アピール文から読み解くWCSC27の見どころ(読み太編)

久々のシリーズ物として、WCSC27に参加しているソフトのアピール文を、私、Qhapaqの開発者が読解/解説していきたいと思います。本シリーズを通じて、皆様がコンピュータ将棋を好きになってくれれば、そして、人工知能の織りなす科学を楽しんでいただければ幸いです。

 

前回記事:

アピール文から読み解くWCSC27の見どころ(NineDayFever編) - qhapaq’s diary

 

 注:以下の考察はQhapaq開発者の予想です。開発者に確認をとっているわけではありません。あくまで参考として楽しんでいただけると幸いです。

 

・気前の良いオールラウンダー 読み太

読み太のアピール文:

http://www2.computer-shogi.org/wcsc27/appeal/Yomita/appeal.txt

読み太はWCSC26組(sdt4の決勝トーナメント生存チームでいえば、読み太、たこっと、Qhapaq、たぬきのもり)の中でも頭ひとつ強いソフトであり、所謂チルドレン世代の代表格とも言えるソフトです。読み太の強さの秘訣は諸説ありますが、私自身は、実装能力、機械学習などの数理に対する知識、人間的な将棋への理解のバランスの良さにあると思っています。

また、読み太はWCSC26の上位8チームの中では最も気前よくアピール文で技術を紹介してくれている(当社比)チームでもあります。

以下、雪辱を果たすべく読み太がどんな準備をしてきているか予想してみましょう。

 

・評価関数は安定路線?

読み太は雑巾の作り方として初手暫くをランダムで指させ、それ以降はdepth7で戦わせたものを使っているとしています。ランダムで指させる手数や雑巾生成時のdepthは地味な調整が延々と続く苦行であり、この手間を如何に減らす(数理的な予想を駆使して候補を削る、自動化して手間を減らすetc)かが勝負と言っても過言ではないのですが、読み太は割と気前よく教えてくれています。

# Qhapaqのバイナリで試した時は強くならなかったですが。既に最適化しすぎてたのかも解らぬ

また、雑巾生成時にはあまり枝を落とし過ぎないことがコツなのではないかという示唆を与えてくれています。たぬきチームなども似たような知見を得ているようです(参考)。

 

・進行度をベースとした探索部

進行度によって枝の落とし方を変えることに成功しているようです(R20程度向上)。終盤になるほど手を広く読まなければならない(詰みとかが絡んでくるので)という発想は実はQhapaqも過去に導入を検討したことがあります。Qhapaqの研究では進行度を予想することを諦め、手数や評価値で枝を切り分けた結果、あまり強くならなかったのですが、読み太は駒の並びに対して進行度の点数を割り振るなどをすることでより高精度化させたのだろうと予想しています。

 

・読み太沼は健在か?

読み太は開発者が独自に手動で入れた定跡が含まれており、横歩や角換わり系の将棋だとスゴク長い定跡に捕まる可能性があります。QhapaqはWCSC26でこれをモロに喰らってしまい(30手目ぐらいまで延々と定跡で1秒指しされた)、ほぼ互角で終盤を迎えたものの最後は持ち時間の差で押し切られてしまいました。

sdt4を経て真やねうら王型の定跡(初手38銀などの力戦型の定跡)が登場したため、読み太のような狭くて深い手動定跡がうまく機能する機会は減りましたが、真やね型の定跡外しは定跡off指しに弱く、定跡off指しは手動定跡に引っかかりやすいという三すくみの関係は健在であるため、対策を怠ってひどい目に合わされるソフトがひとつは出てくるだろうと思っています。

 

・Qhapaq的総評

WCSC26の雪辱を果たしたいところです。あと、読み太の中の人は対局中に手の意味を開設してくれたりするので戦っていて楽しいですので、WCSC27でも当たりたいところです。