アピール文から読み解くWCSC27の見どころ(NineDayFever編)
久々のシリーズ物として、WCSC27に参加しているソフトのアピール文を、私、Qhapaqの開発者が読解/解説していきたいと思います。本シリーズを通じて、皆様がコンピュータ将棋を好きになってくれれば、そして、人工知能の織りなす科学を楽しんでいただければ幸いです。
前回記事:アピール文から読み解くWCSC27の見どころ(Apery編、書きかけ) - qhapaq’s diary
注:以下の考察はQhapaq開発者の予想です。開発者に確認をとっているわけではありません。あくまで参考として楽しんでいただけると幸いです。
・極北から来た侵略者:NineDayFever
NineDayFeverのアピール文:
http://www2.computer-shogi.org/wcsc27/appeal/NineDayFever/NDF-2017.txt
評価関数、KPPTの進化を語る上でNineDayFeverを抜きにすることはできません。
深い読みの評価値を浅い読みに近づけるようにする学習指針や、KPPに手番の概念を入れるといった技術発展の切欠を作ったソフトであり、NDFの解説は、WCSCのアピール文史上、最も引用されたものの一つです。
以下、NineDayFeverが今回齎すであろう"侵略"を読み解いていきたいと思います。
・古参らしさと新しさの共存
他ソフトと比べて特徴的と言えるのが「三駒関係の各変数を分解して共通する要素を抽出」していること「勝率をベースに定跡を選択していること」でしょう。
三駒の変数の分解は、恐らくは、駒の平行移動の考慮(角の頭に歩を打たれるような局面は玉の位置や角の位置によらず辛かろうetc)であると思われます。これは大樹の枝時代のaperyには実装されていましたが、sdt4以降の雑巾絞り時代には使われる機会が減った技術です。
というのも、ボナメソのように棋譜が少ない場合は、こうした工夫で教師データを増やすことが有意義である一方、雑巾絞りのように大量に教師を作れる学習法では、こうした水増しは必須ではないからです。むしろ、不必要な平行移動を加えることで学習の精度が落ちる危険すらあります。
NDFがこうした技術を使うのであれば、新しい工夫をしている可能性が高いです。私個人は教師データの読みの深さを高めている(高精度な少数データで学習をさせている)か、平行移動以外の抽出方法を開発しているのではないかと考えています。
定跡に勝率を用いるのは、拙作の量子ガシャでも用いられているメソッドです。自己対戦の勝率を基準に定跡を作ると、実は変な変化に引っかかってしまうのですが、NDFはそれを回避できているでしょうか...(それを検証出来るだけ数戦えないのですが orz)
・Qhapaq的総評
NDFはこれまでも様々な技術を生み出してきた先駆者であるため、いきなりレートが急上昇したとしても驚きではありません。アピール文にはsdt4前後で認知された技術を導入する以外のことはあまり書いていませんので、目新しい変化がなければsdt4勢が有利な気もしますが...
WCSC26では当たることができず、開発者ともほとんど面識がないので、本大会でいろいろ教えてもらいたいところです。