レートの持ち時間依存性から考える技巧の敗因と探索部最適化

前の記事でも述べたとおり、探索部の最適化を阻む最大の壁は最適な探索パラメータ(アルゴリズム)が持ち時間に依存することです。本番の長い持ち時間(WCSCでは1試合1時間程度、電王トーナメントでは4時間)で探索パラメタを最適化するのは尋常じゃない計算リソースが必要となるため、探索部の最適化は十分な計算リソースを持った強豪ソフトがほぼ独占的な強さを持っているのが現状です。この差を埋めるには、短い持ち時間でも探索部を最適化できる方法を探す必要があるのですが、其のためには、探索部の持ち時間依存性の出処を探る必要があります。

というのも、第四回電王トーナメントでの技巧は、風のうわさに0.1秒から1秒程度の対局で探索部を最適化してたと聞いていますが、これが本当なら、技巧がトーナメント本番で頓死を重ねたのは、技巧の不運だけではなく、最適化の手法にも問題があったのではないかと思っているからです。

そこで、本稿ではweb上に存在するレートの持ち時間依存性のデータを元に、できるだけ少ないリソースで探索部を最適化する方法について幾つかの予想を垂れ流してみます。

注:あくまで私の予想です。正しいという保証はありません。

1.既存の実験データ
やねうらお氏の実験結果

yaneuraou.yaneu.com

1手1秒-8秒ぐらいの間での実験結果をまとめています。

 

uuunuuun氏の実験結果

http://www.uuunuuun.com/single-post/2016/07/09/%E8%AA%AD%E3%81%BF%E3%81%AE%E6%B7%B1%E3%81%95%E3%82%92%E5%88%B6%E9%99%90%E3%81%97%E3%81%9F%E6%8A%80%E5%B7%A7%E3%81%AE%E3%83%AC%E3%83%BC%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0


探索深さを変えながら技巧を戦わせることで、技巧の勝率のdepth依存性を求めています。depthは厳密には持ち時間とは異なるパラメタなのですが、雑に言えば探索時間はdepthに対して指数関数的な形を持つため、depth差を持ち時間差に焼き直して考えることが可能です。

やねうらお氏のコメント
やねうら王のコメントに

// 終盤で大きく持ち時間を変えると、勝率が5割に寄ってしまうのでそれには注意。

という書き込みがあります(source/extra/timeman.cpp)。


2.なぜ、depthに対して線形にレートが変わるのか
実験データ1,2によると、レート差は持ち時間の比率(≒探索深さ)で近似的に表せるようです。持ち時間2倍ならパワーは2倍と言われると何となく納得してしまいそうですが、実際何が起こっているのでしょうか。

持ち時間を長くすると強くなるということは、幾つかの局面の評価が持ち時間に依存して異なり、また、長い持ち時間のほうが正確な予言ができているということを意味します。

中終盤の勝負所では、正しい手を選べば勝てる一方、間違った手を選べば負けるという少々強引な仮定をしてみましょう。このとき、両者の勝率差は、各々が其の局面を正しく評価できる確率の差となります。言い換えれば、小さいdepthにおいては、局面を正確に読める確率はdepthに線形依存しているというわけです。
加えて、やねうらお氏のコメントから、終盤の詰みが絡んだ局面のほうが、depthに対して急な傾きをしていることが予想されます。

また、depthが増えると正確さの上昇率は鈍ることが予想されます。というか、最後まで線形でい続けると、どこかで読みが正しい確率が1になってしまうので、鈍らざるを得ないはずです。以上をまとめると下のような感じになります。

f:id:qhapaq:20170116002610p:plain


3.探索部を最適化するコツ
探索部の最適化は総じて深さと正確さの損益分岐点を求める問に帰着します。持ち時間が一定とすれば、深く読めるようになるほど、局面を読み落とすリスクが高まるため、両者が釣り合う点を探す必要があるのです。

グラフを見直すと、短い持ち時間での探索最適化でありがちなミスは、depthを上げることによる正確さの上昇を過剰に見積もってしまう(特に終盤)ことであると予想されます。こうした傾向は第四回電王トーナメントでの技巧の頓死や真やねうら王の探索パラメタのstockfishとの比較(+vs魔女の持ち時間依存性についての考察)とも一応合致しています。

以上を踏まえると、短い持ち時間で探索部を最適化する際には、以下のような手が有効であること予想されます。

・複数の持ち時間(3点以上)で勝率を測定し、持ち時間が長くなるとともに勝率が落ちている場合は最適化をやり直す

・終盤は最適化をoffにして比較する

・評価値解析ツールQhashimaを使って、勝率の上昇において、逆転勝利の数がどの程度あるかを確かめる

・評価値が一定値になったら自動投了するようにする(終盤の過大評価による逆転を防ぐため)


4.おまけ:Qhapaqの追加検証
探索部の最適化については、まだ深くやっていない+詳細に書くと大会で勝てなくなるので書けませんが、depthの重要さの局面依存性を確かめるべく、全ての手を1秒で指すソフトに対し、30-60手目だけは1秒で指すソフト、60-90手目だけは2秒で指すソフトを戦わせ、各々の勝率を測定してみました。

30-60 370-42-295
60-90 380-50-270

双方において勝率が上がる一方で、1秒程度の持ち時間では、まだまだ終盤のウエイトが大きいことがわかります。(0.5秒でやると、もっと差が開くのですが、ハードの事情でデータが回収できないのです orz)

ライブラリとして公開しているQhapaqのソフト/ツール一覧

2017.1.22更新

以下のツールをライブラリとして公開します。

現状のQhapaqのツールは定跡や棋譜解析ソフトであり、定義上、ライブラリ登録をしなくても使えるはずなのですが、念の為ここに公開しておきます。

ライブラリ申請の状況などについても此方で公開します。

 

評価値、勝率解析ソフト「Qhashima」

https://github.com/qhapaq-49/Qhashima

 

量子焼きなましを用いた定跡生成ツール群「量子ガシャ、やねうら王Quaga」

https://1drv.ms/u/s!Ag5CrRBmeQHym19Ql_bDEC7fJB19

 

量子焼きなましを用いて作った定跡

https://1drv.ms/u/s!Ag5CrRBmeQHym1eN0ayk5kjCjBLA (戦型自由)

https://1drv.ms/u/s!Ag5CrRBmeQHym2NaMKyetTfVAaJX (四間飛車

https://1drv.ms/u/s!Ag5CrRBmeQHym1zqL3m1rtKNKQNv (一手損)

 

【WCSC27での利用について】

WCSC運営より以下のような回答をいただきました(以下は頂いた返信の抜粋です)。

大会を運営してくださってる方々に、この場を借りてお礼申し上げます。

 

---quote---

現在いただいているものは、ルール上
ライブラリ登録がなくとも使用可能ですが、一方で、ライブラリ規程では
ライブラリは「将棋の指し手生成に関わるプログラム」として、
「開発部」に限定していませんので、ライブラリとして受け付けます。

 CSAサイトでの公開にあたっては
「2017年1月15日時点の内容は、開発部を含まないため、
参加者は、本ライブラリを使用したことを明記する必要はありません」
として公開したいと思います。

---quote---

Stockfishベース探索の終盤力が弱いかもしれない件について

あけましておめでとうございます。電王よりリア充になりたいです。あとnatureに論文出したいです。WCSCでは新人賞と独創性をガチで狙いに行ってます。カステラの法則信者なので書いておきます。今年もよろしくおねがいします。

雑巾絞りによって評価関数学習が大分標準化された一方で、枝狩りの最適化は手法が未だに群雄割拠の状態です。silent majorityが大樹の枝に7割勝っていたような大進歩が未だに残されているかもしれません。最近はstockfish(チェスの強いソフト)を流用するのがブームのようですが、実はstockfish、将棋のそのまま流用すると、終盤が強くない可能性があるのです。

 

1.幾つかの実験結果

stockfishの終盤力に問題がある説の根拠は以下の4つの実験結果です。

 

一、やねうら王Mid vs 真やねうら王 in 0.2秒対局ではMidが勝率53%程度で勝ち越す(10000局程度)

二、やねうら王Mid vs 浮かむ瀬 in 0.2秒対局では浮かむ瀬が勝率55-60%程度で勝ち越す(定跡が異なるので厳密なデータにならない)

三、1秒対局になると真やねうら王と浮かむ瀬の強さはどっこいになるらしい

参考:uuunuuun氏のブログでの考察

四、終盤のfutility margin(≒読んだ深さや手の序列(高い駒を取られるような手は序列が下になる)に応じて枝狩りされやすさを調整する)はあまりやらないほうが強そう

参考:http://www.computer-shogi.org/wcsc26/appeal/Qhapaq/qhaq-2016-may2.pdf (Qhapaqの技術文書 from WCSC26)

 

2.この実験結果が意味することは何か

一、持ち時間によって最適なパラメタが変わる

実験 一、二、三の結果を比べると、最適な枝狩りパラメタは持ち時間によって変わりうることが示唆されています。どうやら、stockfishのパラメタをそのまま使うと、短い持ち時間に過度に最適化されやすい傾向にあるようです。

二、stockfishは枝を狩りすぎている?

真やねうら王の 2016-late-param_body.h を見ると、調整前後でLMR周り(とても雑に言えばfutilityの兄弟)の枝狩の頻度が減らされており、stockfishのデフォルト設定では枝を狩りすぎであることが示唆されています。これはQhapaqの実験四とも一貫性が取れています。

 

3.stockfishは終盤に枝を狩りすぎている(私の見解)

チェスと将棋の特に終盤での特に大きな違いはゲーム中に存在する駒の数です。将棋では大駒を切って敵陣に穴を開け、相手の守り駒を取りながら駒損を解消するといった攻めが成り立ちますが、チェスでは成り立ちにくいです。故に、大駒を切るような攻めは早期に枝狩りすることが良い方針となります。また、「駒の数が減っていれば引き分けだろう」という判断が概ね正しいため、枝を狩りまくっても形勢を読み誤る確率が将棋に比べ少ないと言えます。

大駒を切るような攻めは長い手順になりがちであるため、持ち時間が短く手順を読み切れないうちは読むだけ無駄な手とみなされてしまうため、枝狩りしたほうがいい(Midが0.2秒将棋では真やねより強い)のですが、手順を最後まで読みきれる持ち時間があるならその限りではないというわけです。

 

4.より強い探索ルーチンを作るためにやってみたいこと

最低限、局面進行度に合わせて枝狩りを変えるべきだと思います。長い手順の攻めを警戒する必要があるのは玉がピンチであるときであると考えれば、進行度はKKPあたりを使うのが良いでしょう。

加えて、枝狩りパラメタの最適化作業そのものを高速化することを考えたほうが良いと考えています。パラメタの持ち時間依存性がある以上、長い持ち時間で検証をするべきである一方、長い持ち時間での勝率ベースの最適化は物凄く計算コストがかかるからです。

量子ガシャは当初、枝狩りパラメタの最適化のために生み出した手法だったのですが、Blunderが昔やっていたような方法(各々の局面に対し、枝狩りを少なくして、深く読んだものを教師として枝狩りを最適化する)を検討するべきかもしれません。数十個のパラメタを最適化するのであれば、1000局面ぐらいあれば十分である見込みは高いですし。

 

# seleneの開発者がブログでponanzaの探索部の強さについて指摘していましたが、嘗てBlunderがやっていた研究が枝狩り最適化に活かされているのかもしれません。

 

おまけ.まふ氏もstockfishが終盤弱いと思っているらしい

河童定跡の最大のライバル(?)である、まふ定跡の作者のまふ氏もstockfishの終盤に疑問を感じていらっしゃるようです。原文はまふ定跡のreadmeをご参照ください。

/* ---引用---

私はStockfish系が致命的に将棋と合っていない箇所が終盤に向かうプロセスだと思います。
チェスは駒がどんどん減って行き、終盤は一定の駒数から完全解析されています。
ここまで行かなくとも、ある程度減った段階でほぼパターン化されエンドゲームとなっています。
floodgateで浮かむ瀬同士やSMの対局を見ると、一定の局面からはまったく同じ局面進行が続くことが多いです。
これはチェスが駒がどんどん減り、自分の勝ちパターンに近づけて行くプログラムだからだと思われます。
将棋はまったく逆で、終盤に行くほど持ち駒が増え局面が激化します。
上記が主な原因ですが、Stockfish系に定跡を搭載しても同じパターンで勝ち負けが偏るので、Stockfish系の同ソフト対局では上手くなったかどうか分かりにくいからです。

---引用---*/

 

/* ---引用---

■読み太githubの気になること.txtへの私なりの回答
 
>読み太にやねうら王の評価関数を乗せるとフリーソフト最強らしいのだが、floodgateに放流しても妙に弱い。
浮かむ瀬より強くなっているように見えたのは持ち時間1秒~3秒の短時間の将棋だけ……かも。調べていないのでわからない。 自己対戦の持ち時間は3秒で500~1000局やってきたが10秒くらいでやるべきだろうか。
 
Readme 5(技巧版ver8)にも書きましたが、 私はStockfish系が致命的に将棋と合っていない箇所が終盤に向かうプロセスだと思います。 チェスは駒がどんどん減って行き、終盤は一定の駒数から完全解析されています。
ここまで行かなくとも、ある程度減った段階でほぼパターン化されエンドゲームとなっています。
floodgateで浮かむ瀬同士やSMの対局を見ると、一定の局面からはまったく同じ局面進行が続くことが多いです。 これはチェスが駒がどんどん減り、自分の勝ちパターンに近づけて行くプログラムだからだと思われます。
将棋はまったく逆で、終盤に行くほど持ち駒が増え局面が激化します。 上記が主な原因ですが、Stockfish系に定跡を搭載しても同じパターンで勝ち負けが偏るので、Stockfish系の同ソフト対局では上手くなったかどうか分かりにくいです。
つまり、Stockfish系の影響が強いソフトでは、定跡で勝率がかなり偏ります。

---引用---*/

Qhapaqの四間飛車定跡を公開します

家のネット事情が悪かったり、年末で死ぬほど忙しかったり、一手損の研究に浮気したりと大分遅れてしまいましたが、四間飛車の定跡を公開します。

何処かでデータ処理をミスったのか、四間飛車の仕様なのか大定跡と真定跡への勝率を同時に確保できませんでしたが、上手い解決法が見いだせなかったのでこのまま公開します。

 

【重要】onedriveの課金契約がそろそろ切れるので、このファイルは引っ越しする可能性があります。twitter 等で拡散する際は、本ブログのページを拡散していただけると幸いです。

https://1drv.ms/u/s!Ag5CrRBmeQHym2NaMKyetTfVAaJX

 

【使い方】

やねうら王のstandard_book.dbを差し替えてください。

やねうら王Quagaをお持ちの場合はquantumbookを、そうでない場合はnarrowbookをonにすることを推奨します(多分offだと弱い)

76歩34歩26歩44歩48銀42飛を初期局面としています。後手の四間飛車のみの定跡です。

WCSC参加者が大会で本定跡を使うことも可能です。詳しくは

やねうら王系列最強(?)のQhapaq定跡を公開します(二代目)[12.18マニュアル更新] - qhapaq’s diary

をご覧ください。

【開発経緯について】

もともとの四間飛車は後手勝率が40%弱であり、後手にとって良い戦略とは言えない(とQhapaqは思っている)ようでした。

しかし、量子ガシャと定跡スナイパー理論を用いて、

ver3

vs 定跡off  824 - 50 - 679(45%)

vs 大定跡   887 - 58 - 562(38%)

vs 真定跡 841 - 48 - 658(43%)

まで勝率を高めることができました。

そう。大定跡に強くなってないのです。棋譜を見直すとどうやら大定跡は66歩や56歩から持久戦にしたがる傾向があるようで、河童定跡はどうやら持久戦に対応できていないようなのでした。

qhapaq.hatenablog.com

 

ここから棋譜の数を増やして只管数の暴力を持ち込んだ結果

ver4

vs 定跡off  785 - 49 - 653(45%)

vs 大定跡   802 - 58 - 613(43%)

vs 真定跡 876 - 49 - 572(39%)

そう。真定跡への勝率が下がってしまったのです orz

大定跡と真定跡は序盤戦略が違うので両方同時に対策出来るはずと思ったのですが、データの処理をミスったのか、相性の問題なのか両方とも同時に勝ち越すことはできませんでした。

 

棋譜の抽出を注意深くやれば、もう少し定跡を強くできる気もするのですが、リソース不足につき断念しました。新規アイデア、募集します。

量子ガシャ用のツールの完全版、及び河童定跡の棋譜を公開します

量子ガシャを用いた定跡生成用ツールを公開します。本ファイルのアップロードを以て、河童定跡生成に必要なツールは全部揃った(少なくとも、私が定跡を作るときに使ったツールは全部公開した)ことになります。使い方の詳細はツールに同梱の"look_at_me.txt"をご覧ください。

定跡は作る気はないけど、手元の浮かむ瀬ややねうら王の棋譜を解析して序盤研究したいという方もツールごとDLしてください。使い方については"棋譜抽出用ソフトとして使いたい場合.txt"をご覧ください。

 

【重要】onedriveの課金契約がそろそろ切れるので、このファイルは引っ越しする可能性があります。twitter 等で拡散する際は、本ブログのページを拡散していただけると幸いです。

https://1drv.ms/u/s!Ag5CrRBmeQHym19Ql_bDEC7fJB19

(やねうら王Quaga、bookmaker、carnival.bat、が入っています。これ単体で定跡作成が可能になります)

 

【ライセンス】

大した作品ではないですが、親元のやねうら王に準拠して本ツールもGPLライセンスに従います。本ツールを使って定跡を作成した方は、良ければ本ツールを使った旨を明記していただけると幸いです。

 

【河童定跡の勝利局集】

今まで作ってきた河童定跡の棋譜を量子ガシャ同梱のcarnival.batで分けたものを公開します。Qhapaqが先手/後手勝ちやすいと思ってる局面集として戦略研究に使うもよし、Qhapaqの弱点を探して大会でQhapaqをボコボコにするもよしです。

ver 四間飛車

https://1drv.ms/u/s!Ag5CrRBmeQHym2EFi3jLMa8ChjhU

ver 一手損

https://1drv.ms/u/s!Ag5CrRBmeQHym2C7pZvgOvJD7kz_

 

【読み方】

sente-x フォルダ内には先手が上手くやったと思しき棋譜

gote-xフォルダ内には後手が上手くやったと思しき棋譜が入っています。

将棋guiで作った棋譜ファイルなので将棋guiで読むこと推奨です。

手元の将棋guiがShogiGUIv0.0.5.4なので、バージョンの違いによっては上手くコメントが表示されないかもしれません。お許しください…

後手番でやたら早繰り銀をやりたがるQhapaqの一手損定跡を公開します

四間飛車検証の途中ですが、竜王戦が近いということでQhapaqに一手損を研究させていました。

 

研究の結果、やたらと早繰り銀をやりたがる定跡が完成しましたので、ここに公開します。

https://1drv.ms/u/s!Ag5CrRBmeQHym1zqL3m1rtKNKQNv

 【使い方】

やねうら王のstandard_book.dbを差し替えてください。

やねうら王Quagaをお持ちの場合はquantumbookを、そうでない場合はnarrowbookをonにすることを推奨します(多分offだと弱い)

76歩、34歩、86歩、88角成を初期局面として定跡を作っています。一手損以外の定跡は持たせていません。

WCSC参加者が大会で本定跡を使うことも可能です。詳しくは

やねうら王系列最強(?)のQhapaq定跡を公開します(二代目)[12.18マニュアル更新] - qhapaq’s diary

をご覧ください。

 

【特徴】

もともとの一手損は後手勝率が43%弱であり、ノーマル四間飛車程ではないにしても、後手にとって良い戦略とは言えない(とQhapaqは思っている)ようでした。

しかし、量子ガシャと定跡スナイパー理論を用いて、

vs 定跡off  1938 - 177 - 1640(46%)

vs 大定跡   1949 - 163 - 1665(46%)

vs 真定跡 1904 - 174 - 1790(48%)

まで勝率を高めることができました。

Qhapaqでの後手勝率は47%強であるため、 後手番戦略としては許されるレベル...かもしれません(先手も最適化すればまた後手の勝率は下がるでしょうけど)。

 

【やたら早繰り銀をやりたがる件】

表題の通り、河童一手損定跡はやたらと早繰り銀をやりたがる傾向にあります。特に先手が早繰り銀をやる場合、腰掛け銀ではなく相早繰り銀にしたがるようです。

f:id:qhapaq:20161222011023p:plain

76歩、34歩、86歩、88角成から

42銀、25歩、33銀、48銀、62銀、77銀、32金、36歩、74歩、37銀、73銀、78金、84歩、68玉、85歩、46銀、64銀、58金、52玉

一手損相早繰り銀は今年の竜王戦では出てきましたが、素人観る将にはあまり縁のない形です。でも、Qhapaqは後手でも早繰り銀が好きなようです。加えて、Qhapaqは後手の玉をやたらと52に置きたがります。

相手が腰掛け銀の場合は52玉はやりにくいらしく、42に玉を動かしてきますが、早繰り銀なら兎に角52に玉を置きたいらしく、相手の銀の態度が決まるまで玉を動かさないぐらいの心意気で52に玉を置きたがります。

Qhapaqに長時間読ませたところ、この局面自体はほぼ0点で互角だそうです。

 

上記局面からの後手の勝ちパターンは幾つかありますが、基本的に攻め合いに持ち込み飛車先の突破を目指します。52玉、61金の意味が解りやすい例を一つ紹介します。

f:id:qhapaq:20161222013414p:plain

上の図から、66歩、75歩、同歩、同銀、76歩打、86歩、同歩、同銀、同銀、同飛、87歩打、76飛、77銀打、72飛

この局面でQhapaqに長く読ませると-400ぐらいで後手が良いと言っています。ここで先手の候補手は83角打と出ますが、飛車には紐がついていますし、72角成、同金の局面では先手には飛車を打つスペースがありません。かといって、2筋を突破しても後手玉は遠く、後手からは76歩という解りやすい攻めがある上に角の打ち込みスペースも豊富であるため、後手やりやすいということなのでしょう。

実際の棋譜はここから83角打、76歩打、88銀、71飛、35歩、同歩、同銀、74銀打以下、後手が快勝しています。

一歩間違えれば後手玉は即座に崩壊するので怖くはありますが、一手損には先手早繰り銀としてくる相手をシンプルな攻めで殴り倒せる魅力的な戦法なのではないかと期待しています。

 

【追伸:Qhapaqの勝利局集について】

勝率測定用に使った棋譜が全部で15000局ぐらいあり、これら全てをアップロードすると貧弱な河童ハウスの回線は潰れてしまうため、ネット回線を確保し次第の公開となります。同時に、将棋guiでのコンピュータ将棋同士の対戦の棋譜ファイルの中から先手/後手がうまく指した(一定以下の点数を出さなかった)棋譜を抽出するツール、bookmakermakerも公開予定です。お楽しみに。

Qhapaq振り飛車が居飛車穴熊に勝てない件

今週からは暫く、量子ガシャを使った戦型研究について解説していきます。第一弾はみんな大好き(?)四間飛車です。


【開始局面】
76歩、34歩、26歩、44歩、48銀、42飛

f:id:qhapaq:20161217232659p:plain

まで進んだこの局面とします。理想的には角交換とか中飛車とかから最強の振り飛車を決めたいのですが、ある程度序盤を強制しないと振り飛車を弱いと思ってるコンピュータは振り飛車にしてくれないのです。この局面から定跡無しで戦わせる(0.2秒将棋。1手10万局面程度読んでる)と後手勝率は40%弱。戦型の縛り無しで戦わせると後手勝率は48%前後の値が出る中でこれなので、確かに居飛車に比べて弱いと言えます。

【学習結果(12.17時点)】

量子ガシャを用いて定跡を整備した結果
vs 定跡off 520 - 27 - 462 (47%)
vs 真定跡 553 - 30 - 437(44%)
vs 大定跡 544 - 41 - 391(41%)

となりました。定跡offに対して大分強くなった一方で、何故か大定跡にだけ妙に弱い結果となっています。一体何が起こったのでしょう。

【河童振り飛車は急戦派?】
河童振り飛車定跡に登録された、振り飛車側がうまく勝ったという棋譜を眺めてみます。
vs 定跡off

開始局面から 68玉、62玉、58金、33角、78銀、32銀、96歩、94歩、86歩、72玉、79玉、45歩

f:id:qhapaq:20161217232902p:plain

 

開始局面から、定跡offで最も頻繁に指される手は68玉のようです。居飛車側は78銀を早めに決めて、銀冠、左美濃、高美濃を見せています(これが本当にいい手かは謎です。相居飛車での居角左美濃の影響かもわかりません)。これに対して河童振り飛車は美濃囲いの完成すら待たずに45歩から開戦を要求しています。

人間的な推理をするならば、振り飛車の大きな問題点は手損であるが、居飛車の76歩が陣形の傷になっているうちに勝負をしかければ、実質的な手損は解消できるといったところでしょうか。

【大定跡の秘策 66歩】
開始局面を大定跡に読ませると手の候補が6つ(66歩、56歩、58金、68玉、77角、25歩)あがってきます。この中で、定跡offで指されにくい手が66歩と56歩です。

 

66歩からの変化一例:

62玉、68玉、45歩、58金、32銀、25歩、33角、56歩、72玉、57銀、82玉、78玉、92香、77角、43銀、98香、94歩、68金、91玉、96歩、82銀、88玉、54銀、99玉、71金、88銀(図面では先手番となってますが実際は後手番です)

f:id:qhapaq:20161217233852p:plain

56歩についても、52金、66歩、64歩、68玉・・・以下、持久戦模様になりがちです。

 

66歩と早々に角道を塞いでしまう、46歩からの4筋の歩交換を許すなど、よく言われる将棋の教訓に反しまくっているのが特徴的です。

66歩が形として本当に優れているのか、または、自分から攻めにくい局面にすることで持久戦模様にする確率を上げているのか(※)はわかりませんが、定跡offと大定跡との勝率差を見る限り、振り飛車で持久戦を相手にするのは辛いとQhapaqは思っているようです。

※:コンピュータに指してほしくない手を指させないために、敢えて形を限定するような手を早いうちに指すという戦略は開発者にはよく知られた手法です。例えば、昨年のapery定跡は振り飛車を避けるために初手を26歩に固定している、などです。

 

【河童定跡を用いた居飛車穴熊対策】

勝率的にQhapaq振り飛車が持久戦を苦手にしていることに加え、「基本的にその場の読みに任せるが、序盤から有利になる手をストックしておくことで適宜相手を狙撃する」という定跡スナイパー理論は手数の長くなる将棋を苦手としています。

藤井システムなどの有力な対策を定跡に仕込み、20手ぐらいまではそれを使い、20手目以降はスナイパー理論を使うなどの手も考えられますが、ハム将棋並みの棋力と、4筋の歩がぶつかった後の角換り並の暇しか持たない私には辛い話です。

そこで現在、大定跡との対局回数を増やし、レパートリーの暴力で持久戦での戦い方を模索するという方針をとっています。四間飛車が本当に居飛車穴熊を苦手としているのであれば、棋譜を増やしたぐらいでは勝率は上がらないのでしょうが、棋譜を増やした結果、定跡が短い手数で途切れにくくはなりました。

河童振り飛車定跡を公開する際は、定跡用に喰わせた棋譜も一緒に公開する予定です。居飛車穴熊対策を加えようとすると、ものすごい数の棋譜が必要になってしまいますが、コンピュータが思う勝ちやすい振り飛車局面集として、みなさまの将棋研究に役立てば幸いです。

 

四間飛車の次は一手損角換りに挑戦予定です。一手損は竜王戦で非常に注目を浴びていますし、戦型強制能力が高いためうまく回れば非常に役に立つと言えましょう。Qhapaqの予備実験では後手勝率が43%と少々苦しい戦略と思われているようですが、果たしてどうなることやら。