最近の振り飛車系NNUEでリーグ戦やってたのでデータまとめ中だけどとりあえず公開、海棲哺乳類の対振り能力は凄いですね…
振電改やNNUEkaiFは駆け引きの末に割と居飛車を指すので後で補正が必要。
棋譜 https://t.co/UuYmXWtdjI pic.twitter.com/o91PhldXUH
— W@ndreの中の人🍺 (@ihme_vaeltaa) August 10, 2019

【shinderellaの面白さ】

orqhaやillqhaといった既存の評価関数に対して、人間の棋譜を転移学習させることで作成しています。教師局面数は10万弱であり、学習時間は約3分です。教師が少ないゆえか程よく過学習しており、中々に変態じみた将棋を指してくれるのが特徴です。

あと、shinderella_cuteはorqhaから学習したのにorqha同士を振り飛車の初期局面から戦わせた場合よりも勝率が高くなっています（orqhaミラーでの後手振り飛車勝率は３割未満）。

f:id:qhapaq:20190827212747p:plain — 32金が好きな傾向にある

f:id:qhapaq:20190827212845p:plain — 端歩も好きな傾向にある。時々初手16歩とかもやる

【最後に宣伝】

技術書典７ではコンピュータ将棋振り飛車特集本を頒布します。ネット通販もやる予定ですので何卒よろしくお願いします。

2019-08-25

将棋ソフトの勝率から見る振り飛車迫害の歴史

振り飛車は不利飛車である。きのこたけのこ戦争の煽り文句で出てきそうなこの文言は今や将棋界の暗黙の了解になりつつあります。

タイトルホルダーを居飛車に独占され、勝率の上でも居飛車に押され、プロ棋士にwebニュースで冬の時代到来と言われてしまうなど、振り飛車にとって厳しい時代が到来しています。

さて、人間にとって振り飛車が冬であるように、コンピュータにとっても振り飛車は冬の状態を迎えているのでしょうか。本稿では将棋ソフトの振り飛車の歴史を紐解いていきます。

【将棋ソフトの振り飛車の黎明期（1990〜2000年初頭）】

意外にも(？)、この頃の振り飛車は将棋ソフト界隈のエース戦法の一つでした。というのも、当時の将棋ソフトは水平線効果で序盤、中盤の挙動が怪しく、序盤で変な悪手を指させないためには「初手、3手目は76歩、66歩として角交換を避ける」などの特別な処理を人間が逐一組み込まなければならなかったからです。

この頃もプロ棋士の間では居飛車のほうが主流ではあったのですが、能動的に戦型を選びやすい振り飛車のほうが調整が簡単などの事情で振り飛車を得意とする将棋ソフトが多々いました。

この時期無敵を誇った金沢将棋も振り飛車を得意戦略としており、大会の大一番などで振り飛車を多用している他、市販版の金沢将棋も最強レベルでは振り飛車を積極的に狙ってきています（uuunuuun氏のレーティングサイトからvs 技巧などの棋譜を閲覧可能）。

この頃の将棋ソフトは評価関数と戦型が密接に関係していたため、戦型の良し悪しを判断するのは難しいですが、振り飛車党のソフトの活躍を加味すれば互角に近い戦いができていたと考えられます。

【Bonanzaの到来と居飛車の躍進】

コンピュータの序盤戦事情は2009年のBonanzaの公開に伴い大幅に改善されました。Bonanzaは評価関数をプロ棋士の棋譜から学んでいるため、様々な戦型への対応が可能であり、序盤の精度はまだまだ荒削りではあったものの、アマチュア有段者でも苦戦する程度の精度を持っていました。その結果、手動調整が難しいという理由で敬遠されていた居飛車の戦型も採択しやすくなりました。

とはいえ、当時のソフトは振り飛車を圧倒できるほど居飛車が上手く指せたわけでもなく、人間による手調整の結果振り飛車を採択することもままありました。事実、渡辺竜王（当時） vs Bonanzaの対局や、清水女流王将（当時） vs あから2010の戦いでは将棋ソフト側は振り飛車を採択しています。

【強化学習と振り飛車の苦難】

将棋ソフトにおいて本格的に振り飛車が迫害され始めるのは電王トーナメント以降、特にAperyややねうら王といった強豪ソフトがオープンソースになってからです。戦型選びの細かい手調整から開放されたことに加え、ユーザ数に立脚したデータ収集が進んだ結果、振り飛車は勝率の上でも居飛車に押され始めてしまいます。2016年頃のAperyでの振り飛車の勝率は後手ノーマル四間飛車で45％弱であり、この頃から開発者間で振り飛車を避けるように定跡を調整する（初手を26歩に固定する）戦略が流行し、大会から振り飛車の姿が激減しました。

【絶望の時代へ】

HoneyWaffleなどの振り飛車をコンセプトとした将棋ソフトの登場で振り飛車は完全に絶滅こそしなかったものの、2017年以降も振り飛車の旗色は悪くなり続けています。ソフトがソフト自身の棋譜から学ぶ強化学習が主流になった結果、将棋ソフトは定跡オフでも振り飛車を指さない完全な居飛車党へと転向してしまいました。そして、2017年頃の振り飛車の勝率は後手ノーマル四間飛車で40％前後にまで減少してしまいました。

更に2018年に生まれたNNUE関数によって、より複雑な盤面評価が実現した結果、2019年現在、後手番の振り飛車の勝率は30%を切るレベルにまでなってしまいました。下図はorqha1018で後手ノーマル四間飛車を指し継がせた際の勝率です。30％を切るどころか25%すら切ってしまっています（たややんさんの検証結果を加味すると、流石に勝率が悪すぎる気がしますが、3割を切るのは間違いないと思われます）。

f:id:qhapaq:20190825003648p:plain

対局結果スクショ。うそやん

f:id:qhapaq:20190825004226p:plain

初期局面スクショ。この局面ですでに後手の勝率は25%ない

【纏めと今後の展望】

20年前には将棋ソフトのエース戦略であった振り飛車は今となっては野球の打率並の勝率になってしまいました。将棋ソフトは多様な手を受け入れ戦型の多様化をもたらしてくれると信じていた身としては大変悲しい話です。

しかし、盤面評価精度の向上に伴い、振り飛車に特化した盤面評価の効果が顕著になり始めています。振り飛車に特化した関数は数％ではありますが、居飛車党のソフトよりも振り飛車の勝率が高く、更に良いことに、一部居飛車党のソフトには互角以上の戦いをすることさえもできています。今後の改善によっては振り飛車の更なる躍進もあるかも知れません（ないかもしれません）。

最近の振り飛車系NNUEでリーグ戦やってたのでデータまとめ中だけどとりあえず公開、海棲哺乳類の対振り能力は凄いですね…
振電改やNNUEkaiFは駆け引きの末に割と居飛車を指すので後で補正が必要。
棋譜 https://t.co/UuYmXWtdjI pic.twitter.com/o91PhldXUH
— W@ndreの中の人🍺 (@ihme_vaeltaa) August 10, 2019

【最後に宣伝】

技術書典７で本を出します。お題は「コンピュータ将棋における振り飛車の研究」です。これに伴い現在振り飛車の評価関数を育成しています。現在の時点でorqha1018に対して勝率35％、KristallWeizenに対して勝率50%まで到達しています。振り飛車ソフトの研究というニッチなネタにどの程度ニーズがあるかは解りませんが、宣伝してくれると嬉しいです。

評価関数は今週末 or 技術書典のサークルカット公開に合わせて公開する予定です。よろしくお願いします。

f:id:qhapaq:20190825005532p:plain

現在育成中の振り飛車ソフト。正直何を考えているのか理解できない

2019-07-23

リレー対局で最強将棋ソフトの三すくみを解消する話

【最強将棋ソフトの三すくみ】

第２９回世界コンピュータ将棋選手権(WCSC29)が終了し、入賞ソフトたちの評価関数が公開されました。準優勝のKristallweizenや、初参加＋デスクトップPCで７位入賞の水匠、有志作成の最強関数であるillqha4などが公開されました。

様々な関数が公開されれば「どの関数が一番が強いのか」を知りたくなるのが人間の性。ところが困ったことに、今の評価関数は上位の評価関数について三すくみ状態にあるというのです。

R4400付近で発生している３すくみについて図にしてみました#RRate #illqha #Kristallweizen #orqha pic.twitter.com/gIQrysl2rV
— ロタ (@Rota_JP) 2019年5月12日

三すくみに参加しているのは前述のKristallweizen、illqha4、そして2018年末からSOTAに居座っていたorqha1018（illqhaをベースに筆者が改造したもの）です。（因みに水匠、水匠改も同じぐらい強い）

評価関数の表現力が有限である以上、相性問題はあってもいいのですが、最強ソフトを使って検証をしたい人たちにとってはなんとも落ち着きの悪い話です。そこで本稿では三すくみを起こしているソフトたちを殴り倒すことを目指してみます。

【リレー対局】
将棋ソフト同士の相性問題については、WCSC29の覇者であるやねうらお氏による考察が既に存在しています。

yaneuraou.yaneu.com

端的に言えばorqhaは定跡offでは強い一方で特定の戦型を指定した上での対局ではあまり強くないということです。orqhaは少数高精度のデータで学習を行っているため、序盤の戦型選びに特化した作りになっている可能性は高いです。

しかしこれ、言い換えれば序盤に特化した将棋ソフトを作れているとも言えます。それならば、序盤だけorqhaに指させて、終盤を他ソフトに指させればもっと強い将棋ソフトを実現できるのではないでしょうか？

【実験】
というわけで、定跡オフ、１手１秒、スレッド数４で「序盤30手はorqha、それ以降はKristallweizen」というクソコラエンジンを作成し、orqhaと戦わせてみました。

三すくみの図曰く、この状態ではorqhaが勝ち越しそうですが

結果：
[クソコラ] 270 - 227 [orqha] (引き分けは除外。もとい、対局設定をミスってカウントしてくれなかった)

と、クソコラ関数が勝ち越す結果になりました。統計的にはまだ微妙に怪しいレベルですが、やねうら仮説が正しいこと、リレー対局をすれば将棋ソフトがまだまだ強くなるだろうことが示唆されました。

【実験用コード】
こちらからダウンロードできます。やねうらお氏が開発中のやねうら王用のpython wrapperの「あやねる」の拡張エンジンとなっています。pythonが自力でかけないと使うのは難しいと思われます。

# リレー対局の有効性が示されたら本家やねうら王にも実装されるかも.....知れません

【pythonわからない】
序盤の考察にはorqha、終盤はKristallweizenを使おう（多分　水匠やillqha4もいいぞ！

【技術書典にでます（宣伝）】
次の技術書典にQhapaqも出ます。今回はコンピュータ将棋本（棋譜解析や最弱将棋エンジン開発を中心にした技術を紹介する予定）と機械学習本（Gigazineに掲載された文章要約エンジンIMAKITAなどの機械学習ネタを突っ込んだ本）を頒布予定です。

(AWS台を捻出するために)今期も技術書典に参加します。SDTが消滅して基礎研究に費やせる時間が長くなったので、今期は最弱のコンピュータ将棋を作ってみたいと思います。あと、趣味で自然言語処理を始めました。 pic.twitter.com/udcxM1EgRf
— Ryoto_Sawada🌖Qhapaq (@Qhapaq_49) 2019年7月10日

2019-05-22

長文を３行ぐらいで纏めてくれるChrome拡張 IMAKITA on Chromeを作ってみました

半年ぐらい前にGigazineデビューした文章要約エンジンIMAKITAが遂にChrome拡張になって帰ってきました。

chrome.google.com

唐突ですが皆様は偉い人の長話に苛々したことはないでしょうか。言いたいことは短いのに枝葉をつけた長文を送られるのにウンザリしたことはないでしょうか。

そんな皆様の声（？）を受けて、半年前に長文を３行ぐらいで纏めてくれる（厳密には、文章全体の中で特に重要度の高い文を抽出してくれる）エンジン IMAKITAを作ってみました。

https://www.qhapaq.org/imakita/

IMAKITAは私の想像以上に好評であり、なんとGigazineにも掲載してもらえました。そして、多くのユーザから「ハイライト機能が欲しい」「逐一サイトにデータを貼り付けるのが大変だ」というアドバイスをいただきました。

そこで、IMAKITAをブラウザ用のアプリにすることにしました。使い方は至ってシンプル。テキストを選択して右クリックからIMAKITAを呼び出すだけ。簡単！！

【使用例】

ニコニコニュースを参考に、いかがでしたかブログの王道である「綾瀬はるか　恋人」で検索し最初に出たページを圧縮してみました。要約する行数は7行、各々の要約文の長さは10文字以上になるように設定した結果が以下のとおりです。

----------

綾瀬はるかの本名や年収は?熱愛中彼氏と結婚?髪型がかわいい – ロバ耳日誌 https://robamimireport.com/ayaseharuka-honnmyou/
綾瀬はるかの本名は？
綾瀬はるかさんの本名は蓼丸綾というみたいですよ.
読み方は「たでまる　あや」です.
綾瀬はるかの年収はどのくらい？
綾瀬はるかさんはほぼ毎日テレビに出ていますよね.
CM1本あたりのギャラは4500万円ですから、CMだけで7億2000万円ですよ！

ドラマや映画にも出ていますから、10億円を超えていると考えられますね.
ちょっと綾瀬はるかさんの髪型画像を集めてみました.
綾瀬はるかさんは前髪を常に短く作るのが特徴ですよね.
童顔の人が真似すると幼くなりすぎてしまうので注意が必要です.

---------

本名と推定年収と髪型に関する要約が綺麗に抽出出来ました。彼氏については結論が出ていなかったからかAI様は完全にスキップしてしまいました。

【機能について補足】

生成された要約はクリップボードに自動的にコピーすることが出来ます。キュレーションサイトを圧縮して呟くという賽の河原遊びも楽々出来ることでしょう。

要約分に対応する文字をハイライトする機能も実装していますが、jqueryの仕様なのかhtmlタグが入っていると上手く機能しません。解決方法知ってる人教えてください><

また、本家IMAKITA同様、多言語にも対応しています。英語、フランス語、スペイン語、ドイツ語に対してもテキストから原語を自動で推定し、要約を生成してくれます。

形態素解析（文章の単語を区切る機能）の精度が悪いため、恐らく本家に比べると精度がやや劣ります。

【ソースコートと論文】

IMAKITA on Chromeはgithubでコードを公開しています。また、技術的解説文書もアップされています（日本語版の解説記事も書く予定ですが予定は未定ですorz）。

2019-05-07

新時代のクラスタシステム ~MultiponderとPreponder~

第２９回世界コンピュータ将棋選手権に参加された皆様、感染してくださった皆様、改めてお礼申し上げます。Qhapaq di molto(QDM)は５位入賞という結果を残すことが出来ました。

本大会でQDMはPreponderを使ったクラスタシステムを構築しました。Preponderは前年度優勝ソフトであるHefeweizenが採用したMultiponderを発展させたシステムです。本稿ではQDMの躍進の屋台骨となったPreponderについて解説していきます。

ソースコードは此方からどうぞ

github.com

【システムの概要】

【Ponder】

コンピュータ将棋におけるPonderとは相手の手番中に先の展開を予想しておくことを意味します。人間の将棋でも予想外の手に慌てふためいたり、逆に自分の手を相手に読まれた結果、とっておきの一手が即指しで返されてしまったりすることがあると思いますが、コンピュータ将棋でも同様のことが起こります。

従来の将棋ソフトの多くは自分の指し手を決める際に相手の返しの手を一つ予想しておき（予想手）、相手の手番中に予想手を指された後の局面を検討します。予想手が当たれば相手の思考時間を自分の持ち時間に加えられるし、外れればその読みは破棄します。予想手の一致率はソフトの相性にもよりますが５割強程度と考えられています。

f:id:qhapaq:20190507190246p:plain — Ponderのイメージ図

【Multiponder】

一方、Multiponderでは予想手を複数用意し、それぞれの予想手について先の展開を読みます。予想手を５〜６程度用意すればほぼ全ての局面で相手の手を当てることが出来ます。複数の計算ノードを用意し、それぞれに局面を割り振ることで、実効的な持ち時間を３割程度増やすことが出来ます。

f:id:qhapaq:20190507190205p:plain — Multiponderのイメージ図

【Preponder】

PreponderではMultiponderに加え自分の手番中に２手先の展開を読ませることで実効的な持ち時間をさらに増やすことができます。２手先を読む都合上、Multiponder程の的中率は出ませんが、当たると時間を大幅に稼ぐことが出来ます。Preponderが外れた(自分の手が予想手と一致しなかった)場合はPreponderはMultiponderと等価になります。

f:id:qhapaq:20190507190145p:plain — Preponderのイメージ図

【実験結果】

Qhapaqの自己対局でPonder、Multiponder、Preponderを比べた所、PreponderはPonderだけの時に比べ実効的な持ち時間が5割増し程度になることが解りました。大会当日でもPreponderによって序盤から長考をした結果、有利な戦型持っていけたケースが多かったと考えています。

f:id:qhapaq:20190507190112p:plain — Ponder, Multiponder, Preponderの比較