Qhapaqの評価関数を公開します

WCSC27の最終日が終わるのを待ってから公開しようと思っていたら、elmoが最終局開始と同時にバイナリを公開してくれたため、恐らく出番がなくなってしまったQhapaqのバイナリですが、公約通り(?)公開します。

 

注:onedriveにアップしていた時はonedriveの不具合でDLできなかったようでしたので、バイナリはgithubに引っ越しました。現状、DL障害は生じてないようです

 

github.com

 

qh.zipが本体です。
 

河童全力定跡 (Qhapaq_z.db)

 

【使い方】

最新版のやねうら王のバイナリを上記バイナリにすげ替えていただければOKです。Qhapaqは定跡採択とクラスタ化とtimemanを改造していますが、持ち時間固定対局に於いてはやねうら王と動作は同じです。

 

【定跡を使う際の注意】

定跡については、量子焼きなましで作っているため時々ゴミが入っています。narrowbookをonにしてゴミ手を回避するようにしてください。

 注:やねうら王のnarrowbookはデータベース上での採択率が10%以上の手を等しい確率で選ぶ仕様ですが、河童全力定跡はデータベース上での採択率にそのまま従って手を選ぶ仕様になっています。どうしようもないクソ手の大半は採択確率が10%以下になっているため、棋譜を楽しむ上ではさほど問題はないと思いますが、レートをできるだけ正確に測定したい、河童定跡を狙撃したい場合には適さない可能性があります(やねうら王のnarrowbook上でのQhapaqの勝率は未検証)

 

【現在解っているQhapaqのスペック】

有志の皆様、検証誠にありがとうございます。取り急ぎ、本ブログで私の手元PCでの測定結果について公開していきます。

 

1.1手1秒4スレ、やねv_441 河童バイナリ+真やね定跡 vs 真やねバイナリ+真やね定跡

461 - 3 - 226(レート差約120)

 

2.1手1秒8スレ、やねv_441 河童バイナリ+真やね定跡 vs 真やねバイナリ+真やね定跡(上記実験は自作の自己対局スクリプトでやったため信用できぬと将棋guiで再測定)

113-5-51(レート差約130)

追加実験結果

491-11-228(レート差約130)

 

3.1手1秒8スレ、やねv_441(ただし定跡探索は河童仕様) 河童バイナリ+河童全力定跡 vs 真やねバイナリ+真やね定跡(現在測定中)

85-3-26(レート差約200。流石に測定誤差が載ってると思う)

追加実験結果

 536-8-203(レート差170)

 

実験結果を眺めて思うこと:

Qhapaqについては、どうやら、評価関数でレート+130、定跡でレート+40程度のようです。

Qhapaq同士の対局では vs 真やね定跡への勝率が56%(ただし、0.1秒対局)だったので、意外と綺麗にレートの足し合わせができているようにみえます。

有志によるvs elmoの実験(本当にありがとうございます!)でelmoがQhapaqに6割ぐらい勝つようなので(持ち時間依存性があるようですが)、単純に考えればelmoと真やねのレート差は200ぐらいです。

elmoの登場によって評価関数作りが急激に進むのと同時に、評価関数の品質評価にも長い持ち時間が必要であることが示唆されて無課金勢的には辛い話です orz

 

Qhapaqの今後について:

私がgithubとかの使い方を覚え次第、河童絞りとやねうら王のクラスタ化部分についても公開していきます。学習やクラスタ化の理論についてはコード公開の際に書いていきたいと思います。

今後はQhapaqの各種ツール、バイナリなどのデータをライブラリとして公開していきたいと思います(評価関数はapery、探索部はやねうら王と依存関係がかなり面倒くさいですが)。

他にも優秀なライブラリ公開者がいるので、Qhapaqについては理論説明がしっかりしていること、更新頻度が高めなことを売りにしていく......予定です。