第五回将棋電王トーナメントのお礼と本大会でのQhapaqの戦略

第五回将棋電王トーナメントを視聴してくださった皆様、並びに、大会に参加した開発者の皆様にお礼申し上げます。

Qhapaq_conflatedは並み居る強豪を圧倒的幸運(とひと握りの努力)で倒し、5位入賞という大変名誉な結果を残すことが出来ました。

 

本体のうpの遅延ですが、大会実況と大会前後の情報戦で自宅の貧弱ネットワークが死に、有給を使いすぎたことに依る仕事のしわ寄せでネット環境(と書いて無料wifi付きの吉野家)にいくタイミングがないので本当に申し訳ないですがもう暫くお待ちください。

 

以下、御礼に組み合わせて大会中Qhapaqが考えていたことを雑に書き下していきます。

 

・四駒、爆死するんじゃね?

KPPTの時代は終わりだ、と開発者たちが圧倒的開発力を見せる中で、Qhapaqは四駒爆死読みでほぼ全てのリソースをKPPTにつぎ込んでいました。科学者の癖に。

理由としては学習リソースが確保できる気がしなかったのと、ponanza_chainerレベルの化物がNNで成し遂げたレートが2000程度で、depth 1のelmo搭載型やねうら王がレート1000前後は行く(技巧depth1=700から推定)ことを加味すると、四駒の表現力ボーナスは大したことがないと睨んでいたからです。

後出しジャンケンが半端ないですが、一応この読みが当たったお陰で、リソース差の壁をほんの少し埋めることが出来ました。

 

・時間攻めと河童パーク定跡

timemanに対する効果の測定は困難です。ponderを加味しなければならないため、レート測定が大変面倒なことになります。ただ、私自身はtimemanは投資に値するものだと思っていました。

wcscの時に、対戦回数が少ない(100回も戦ってない) and 評価関数が同じなため持ち時間差やponderの差が響きやすいとは言え、定跡+timemanを搭載したqhapaqは搭載していないqhapaqに7割弱勝っていた(定跡搭載vs定跡offの持ち時間一定対局は6割弱)ので、今回も時間攻めによる暗殺をやる気満々でした。

今回は定跡狙撃よりも時間攻めに重きをおき、評価値が悪くない、定跡に当たりにくそうな展開として、真やねうら王が愛顧していた38銀型(後手は62銀型)を河童パーク定跡とし、twitter上でリソースを集りながら作成を急ぎました。

 

サイリウムという名の盤外戦

設営日に当日は千駄ヶ谷エレジーがライブで行われるということを知り、ぽんぽこ開発者の野田さんと画策してサイリウムを振ることにしました。以下、私サイドでの感想戦

 

私(ライブとなるとヲタ芸が欲しいな。しかし、このチェックシャツばかりの開発者たちにガチのヲタ芸は難しそうだし、装置を壊したりするとアレだ)

私(ええい、面倒だから野田さんに無茶振りしよう)

私「というわけで、なにかヲタ芸挟むと面白いと思うんですが、なんか良いヲタ芸ないっすかね?」

野田さん「(何かを閃いた様な顔をしながら)それだ、サイリウムを振りましょう」

私(あ、こいつ課金勢だ)

野田さん「2局やるなら2色分、参加者全員に配るのです」

私(あ、こいつガチ課金勢だ)

私(今更振り上げた拳は引けないしな)「いいでしょう、料金は現状では折半として、入賞したら賞金で補填するってのはどうです?」

野田さん「では、それで」

チームメイトのItoさん「え、なに、悪ふざけするならカンパするよ?」

私(あ、こいつも悪乗り勢だ...)

----

2日目

私「というわけで、サイリウムは私とたぬきさんの折半なのですよ。賞金が出ればそれから補填しますが」

shotgunの芝さん「むむ、それなら。仮にお二人が賞金とれずに、うちが取れたら私がカンパしましょう!」

私(あ、この人もガチ勢だ)

 

そんなこんなで多くの人に支えられたサイリウムですが、結局両方とも入賞したお陰でその代金は私と野田さんで折半となりました。

 

# この辺の盤外戦は野田さんのブログ第5回電王トーナメント参加記録 - nodchipのブログを読むと一層楽しめるかも知れません。

 

・マッチングミス

1試合目を勝っていたのに負けにされてしまった関係で、2戦目のマッチングがずれてしまい、計らずもソルコフを損する展開になってしまいました。しかし蓋を開ければQhapaqが最初の2戦で戦った相手は大健闘をしてくれ、ソルコフが増えた結果Qhapaqは不幸にも黒塗りの高級山(aperyにponanzaが鎮座する超厳しい山。師匠曰く、決勝トーナメントの強制収容所)に送られてしまいました。損した言ってサーセン

 

・河童パークは爆死したのか?

予選リーグの最後の3局、Qhapaqは後手を引き続けた上に、33金(41銀、32金の状態で角を33にあがり同角成、同金となった展開)戦法を繰り返し、一度も良くなることなきまま敗れ続けました。これはQhapaqの評価関数の脆弱性(Qhapaqはそもそも33角成をあまり良い手と思っていない)に起因するものでした。

予選当日、私はこの戦略を酷く後悔していましたが、よくよく考えると読み太やnozomi相手には後手を引きながら上手く戦えています。

河童パークの脆弱性は先手が純粋に飛車角先を伸ばし続けた時(定跡offでやりやすい手)に起こることですが、もしかしたら、これまでの定跡狙撃合戦の影響で読み太やnozomiは急過ぎる戦いを仕掛けないよう(単純に飛車角の歩を伸ばすことを避けるよう)に調整していたのかも知れません。

即ち、定跡読み定跡としては機能していたとも言えるのです。

 

・1日目夜の攻防

1日目終了時点で2日目の山のどうしようもない手強さにsan値がダダ下がりでした。しかし、順位の期待値を上げるべく夜を削って策を練りました。まずはponanza対策を諦めました。評価関数、探索の双方で負けている可能性が高かったからです。ponanzaは定跡を使ってこないので、そこ狙撃できればチャンスはありますが、それを用意する時間もありませんでした。

そして、相手をaperyに絞り、aperyの弱点となりうる部分を列挙しました

・やねうら王の方が1日目時点では探索部が強そう

・時間配分はワンチャンスある

・nozomiとのテスト対局での頓死など逆転負けをすることがある

・定跡はあまり積んできてなさそう

以上を踏まえ、探索の差で稼げる小さな利益を積み重ねること、一局面の読みの精度の差で取り返しのつかない展開になることを避けることを目指しました。具体的には

・玉の危険度が絡みやすい横歩

・角の睨み合いが続く角換わり

・決着までが長引きやすい相掛かり

を狙いました。この判断には大昔に千田先生が書かれていた記事を参考にしました。具体的には、wcsc27の定跡を12手だけ使う(評価関数の質が変わった手前、狙撃は狙えないと思った)ことにしました。

 

・2日目は只管祈る

1時間対局でのtimemanをテストするのはほぼ不可能なので、2日目は只管祈っていました。平岡さんに「強くならない独自性は独自性じゃないという風潮は嫌ですが、自分についてはライブラリで楽してる以上、独自性に強さを求めていきたいし、元のライブラリより強くならないなら出ないという心つもりでやってます」とイキリ発言をする以外は大体祈ってました。

2日目も1日目同様に、兎に角後手ばかり引きましたが、aperyを倒し、ponanzaに対しても一瞬だけ形勢を取り戻し、やねうら王を倒しと謎の躍進を見せました。定跡をしっかり用意してるであろうやねうら王に横歩の入り口で定跡を切らす真似をするのは死ぬほど怖かったですが、Qhapaqが飛車を変な場所に動かしたお陰で早い段階で定跡を外れてくれた(これもよもしたら脆弱性なんじゃ)ため、無事に時間攻めをすることが出来ました。

 

・振り返ると振り駒運も悪くなかった

5位決定戦がelmoと聞いた時は「apery、ponanza、やねうら王、elmoって、参加ソフトのレートを上から4つ並べたのとほぼ同じじゃね」と思うと同時に「此処だけはなんとしても先手を引きたい」と考えていました。というのも、elmoもまた定跡巧者であり、先手で此方を狙撃できる定跡を沢山持っていると考えられたからです。昨日の戦いから後手パーク定跡は通用しないし、wcscの後手定跡で横歩にしてしまったら、そこから一方的に時間を削られかねなかったのです。

elmoは兎に角当たりたくない相手でしたが、同時に当たる価値がある相手でもあります。というのも、最終試合ならネタばらしをしても次の対局で対策されることがないので、ネタばらしをし放題だからです。

 

私「tkzwさーん、timemanどうしました?」

瀧澤さん「slowmoverを80 90にしました。そちらは?」(瀧澤さんより訂正いただきましたthx)

私「MoveHorizonを128にしてslowmoverは110にしてます」

 

インタビューなどで偉そうにいろいろ語りましたが、実はqhapaqのtimemanはやねうら王に比べ2バイトしか差がありません。方方の理論研究から、optimum timeを一定に保ちながら、150手前後で時間を使い切るようにするのがベストだと導出していたからです(この2バイトの改造で、なぜ上記の理想的状態に持ち込めるかの説明はまた今度...の予定)

 

2バイトで独自性とはこれ如何にですが、導出には20年近く蓄え続けた数理パワーと机の前での数十分の悶絶が伴っていますので許してください。保証は出来ないけど、少し強くなってると期待してます(強くなってなくても、他に強くなった部分はあるし、勝てたからいいんだよ!

 

・狼ヘッド

狼ヘッドはsdt4でたぬきのきぐるみを着た変な人を倒すために、ドンキのハロウィンセールの売れ残りから買った獲物なのですが、着けてると色々と縁起が良いのと、対局開始と終局時にこれを装備して挨拶してたことから、正装=狼ヘッドという図式が成り立ってしまったので、定番化してしまいそうです。

喋るときに不便だし、全く私の顔が残らないのも癪なので、早く色褪せるとか穴空くとかしないかなと思いつつ、ちょっと保存状態の悪そうな棚に閉まってあります。

 

・入賞スピーチの焼き直し

ライブラリ勢の活躍やponanzaの引退のお陰でsdtのゲームバランスに疑問の声が上がるのも然るべきことだと思います。また、Yorkieの敗退やマッチングミスなど、運営に対する不満もゼロではないかも知れません。私自身は、ライブラリ勢が嫌いなら嫌いで良いと考えています。ただ、ライブラリ祭りが嫌いだからとsdtを観るのをやめてしまう前に、それを声に出して欲しいとお願いしたいです。sdtは見てくれる人があってのイベントであり、見てくれる人のためにルールが組まれます。皆様の声にはsdtを作る力があるし、sdtが続くことは、コンピュータ将棋の発展にも重要だと信じています。

 

今後共、Qhapaq。いや、コンピュータ将棋をよろしくお願いします。