【人間の棋譜からの転移学習】最強クラスの振り飛車評価関数 shinderella を公開します
技術書典7の宣伝も兼ねて現在開発中の振り飛車の評価関数を公開します。
その名もshinderella(振デレラ)です。よろしくお願いします。
【ダウンロードは此方から】
Qhapaq Research Labのデータベースからダウンロード可能です。
Cute(0815、体感的に変態棋風)、Cool(0825、体感的にオールラウンダー)からお選び頂けます。shinderellaは、やねうら王上で動かせるNNUE形式の評価関数です。やねうら王の導入についてはuuunuuun氏のページなどを参考にしてください。
【shinderellaの強さ】
現在公開されている最強の振り飛車関数である、NNUEkaiFや振電改と同等程度の強さであると考えられます(スクショはcuteのもの。coolは測定中)。ただし、W@ndreの中の人氏が言及しているように、振り飛車ソフト間にも相性問題があるので厳密なレーティングは難しいと思われます。
最近の振り飛車系NNUEでリーグ戦やってたのでデータまとめ中だけどとりあえず公開、海棲哺乳類の対振り能力は凄いですね…
— W@ndreの中の人🍺 (@ihme_vaeltaa) August 10, 2019
振電改やNNUEkaiFは駆け引きの末に割と居飛車を指すので後で補正が必要。
棋譜https://t.co/UuYmXWtdjI pic.twitter.com/o91PhldXUH
【shinderellaの面白さ】
orqhaやillqhaといった既存の評価関数に対して、人間の棋譜を転移学習させることで作成しています。教師局面数は10万弱であり、学習時間は約3分です。教師が少ないゆえか程よく過学習しており、中々に変態じみた将棋を指してくれるのが特徴です。
あと、shinderella_cuteはorqhaから学習したのにorqha同士を振り飛車の初期局面から戦わせた場合よりも勝率が高くなっています(orqhaミラーでの後手振り飛車勝率は3割未満)。
【最後に宣伝】
技術書典7ではコンピュータ将棋振り飛車特集本を頒布します。ネット通販もやる予定ですので何卒よろしくお願いします。