妖怪惑星Qhapaqの定跡も公開しました

此方からダウンロードできます。今回は定跡は2種類あります

Release 定跡のページ · qhapaq-49/qhapaq-bin · GitHub

 

【Qhapaqが考えたWCSC28の定跡のメタゲーム】

WCSCは計算資源が無制限であるため、長い定跡を作るのはリスキーであると考えていました。序盤の局面についても長く読ませることで、ソフトは自身が勝ちやすい戦型に誘導することが出来ることがわかっていたからです。より具体的には、最初の30手だけ持ち時間を倍にした場合、30−60手目の持ち時間を倍にするのとほぼ同等のレート上昇が得られることを実験的に確認していました。

これを踏まえ、WCSC28の妖怪惑星Qhapaqでは初手10手程度だけを定跡として用意し、あとは当日のマシンパワーに任せる方針を取りました。

しかし、初手10手と言っても油断すると33金角換わりのような脆弱な戦型を選ぶ可能性があります。そこで、戦型毎に勝率を測定し(※)先手なら横歩か角換わり、後手なら相掛かりか角換わりを狙いに行くのを基本とすることにしました。

より具体的には相手の手によらず先手は76歩、26歩を、後手は84歩、85歩を指すようにすると同時に、角換わりや横歩の入り口でその他の手を指さないように定跡を調整しました。

※:なお、この研究成果は将棋本で再利用しています

 

この調整だけでもresivn value 200の試合で book offのQhapaqに対して55%弱勝てることを確認しています。

 

2次予選でのQhapaqは角換わりありの定跡(kusokora3.db)を使っています

 

【決勝での心変わり】

決勝リーグでも同じ定跡を使う予定でいましたが、他の対局者も似たようなことに気付いた結果か角換わりが大会全体で多かったこと、定跡巧者の開発者が多く、角換わりで長い定跡に持ち込まれることが多かったことを加味し、角換わりの局面で角道を塞ぐ定跡を新たに用意しました(あまりに突貫すぎて角道閉じる先の手がないという糞仕様)。

決勝リーグで使った定跡( kusokora6.db )はあまりよい成績を残すことが出来なかったので其の是非は微妙だと思います(一番対策したかったPALにはガッツリ対策されてたし)。ただ、大会全体の戦型のバリエーションの増加には貢献できたと思います。

 

【定跡の今後】

WCSC28の決勝リーグソフトの多くが評価関数で似たようなレートになっていることを加味すると、評価関数を今以上に強くするのは楽ではない(KPPTにせよ、NNUEにせよ)と思います。

私自身はKPPTがレートの上限を迎えたとは思っていませんが、限られた資源でソフトを強くする上で、評価関数に投資するのがベストであるという状況は今後必ずしも続かないだろうと考えています。

より具体的に言えば、評価関数はライブラリや有志開発に頼り、其の資源を定跡に回すほうが大会的に勝てるソフトが作れる可能性が有ると思っています。特に将棋が強い人がソフトを使って定跡を監修すれば、まふ定跡がsdt5で大暴れしたような現象が起こりうると考えています。

定跡は評価関数に比べると検討用途で使いにくいなどのユーザ視点では美味しくない点はありますが、コンピュータ将棋の大会が今まで以上に人間臭い大会になる事自体は、それはそれで面白いのではないでしょうか。

 

私も定跡本を買って勉強しなければ...!

 

 

妖怪惑星Qhapaqの評価関数を公開しました

長らくおまたせ(?)しましたが、WCSC28で7位入賞を果たした妖怪惑星Qhapaqの評価関数を公開しました。

 

DLは此方からどうぞ

Release qhapaqの評価関数群 · qhapaq-49/qhapaq-bin · GitHub

 qhwcsc28.7zが妖怪惑星Qhapaqの評価関数です。

 

【レート測定結果】

手元では1手1秒12スレッド、狸互角局面集で8手目を初期局面にレート測定を行っています。

 vs aperypaq

243 - 8 - 179(57.58% R53.1)

 

vs くじらちゃん

178 - 8 - 204(46.6% R-23.68)

 

aperypaqには有意に勝ち越せていそうです。クジラちゃんは微妙に負け越してる気がしなくもないです。

 

Qhapaqの評価関数は上記環境でのレートを最大化するように最適化しています。検討用ソフトとしての利用に耐えられるよう、オールラウンダーな棋風を目指していますが、スレッド数が極めて多い場合や定跡offでの挙動は怪しいかも知れません。

 

# レートの下馬評的にしては大会で勝てなかったのを根に持ってるだけという説も

# くじらちゃんも大会で苦戦してましたし。

 

 

第28回コンピュータ将棋選手権の感想戦(雑談編)

2018.05.08に修正

第28回世界コンピュータ将棋選手権に妖怪惑星Qhapaqとして参加しました。悲願の決勝リーグ進出を達成し、最終的な順位は7位入賞となりました。応援してくれた方、大会を支えてくれた方、大会を楽しんでくれた方全てにお礼申し上げます。

 

本稿では御礼に変えて実況などでは出てきにくい、Qhapaqから見た舞台裏のうち技術と関係ない話(技術的な話はもう少し検証が必要なので)をしていきます。

 

Crazy shogi、マジでCrazy:

本大会の注目株の一つであったCrazy shogi。海外勢としては2人目なのですが、日本語を話せない参加者が来るのは本当に久々で英語対応に苦慮しました。基本的にYSSの山下さんが対応をしていましたが、山下さんが大会運営に出ているときは代わりに私が説明をしたりもしました(中継ブログの画像でやたらRémiさんと一緒に写ってるのはそれだ)。

開発者のRémiさんは本当に将棋を知らないらしくCrazy shogiが矢倉を指したのを見て「Foooo,ゼロから学ばせたDNN将棋が矢倉指してるゥウ」と喜ぶ観戦者を尻目に「Hey,河童、未だ始まったばかりだが彼らは何を喜んでるんだ。もう決着ついたのか?」と呑気な様子でした。

Crazy shogiは対局毎に評価関数を差し替えていました。曰く「Alpha zeroの学習で強くし続けている」とのことです。

私「Rémiさんは強くなってるだろうと言ってますが、将棋強い民的にこの棋譜はどうです」

強い民(誰だかは忘れた)「序盤戦略は悪くないんだろうけど、人間的にはちょっと奇妙ですね」

私「あ、でもCrazy shogiってCGP(レート3500級のソフト)に勝ったみたいですよ」

強い民「それ、人間的には一番手に負えないやつですね」

 

将棋民怖い:

大会終了後に詰将棋カラオケをやろうと思っていたので、10分で解ければ2段の17手詰めなどが記載された書籍を持ち込みました。カラオケをやりながら倒すのであれば平常時で1分ちょいで解ける問題が適切だろうと考え、会場にいた将棋が強そうな人たちに解いてみてもらいました。

私「どうです?」

PALの山口さん(東大将棋部)「N分で解ければM段ってのは結構適当ですからね。あ、解けました(大体1分ぐらい)」

私「東大将棋部パねえですね。ちなみにこれをプロがやったらどうなります」

山口さん「一瞬じゃないですかね」

私「と、いうわけで千田先生どうです」

千田先生(指で駒を動かすモーションをする)

千田先生「解けました(大体30秒ぐらい)」

私「プロ棋士パねえっすね。あと、詰将棋解くときに指って動くものなんですね」

千田先生「いや、今回のは解けた後に手数確認するためにやっただけです」

私(アカン)

 

ライバルソフト強い:

今回のQhapaqはシード組。此方はaperypaqよりも強い評価関数を用意していた(そして、floodgateを観る限りaperypaqを大いに引き離す関数はないように見えた)ので、それなりに勝つ気でいましたが、ライバルソフトの強さに終始圧倒されていました。個人的に一番記憶に残ったのはPAL(二次予選で席が隣だったので色々話したのもありますが)です。

 

決勝リーグにて

私「昨日は後手角換わりで負けたので、今日は意表をついて角換わり拒否にしてみました。定跡巧者相手に角換わりは危なそうなので。」

山口さん「いいんですか、銀は78ですよ?」

私「Qhapaqの評価値的にはそこまで問題はないです。定跡外れてくれたようで何よりです」

山口さん「いや、これは先手が速攻を決めれば結構勝てるので定跡優先度が低いからそんなに作ってないってのが...」

私「ふぇ?」

(宣言通りQhapaqが一方的にボコられて爆死する)

 

ちっ

 

HER○Z大人気:

※:開発のデスマ故か記憶がパラレルワールドに飛んでいたので修正。

 

大会1日目の打ち上げでの話

私「評価関数ガチャに失敗しましたが、HEROZのIPO参加ガチャにも失敗しました」

打ち上げ参加者「あれ、めっちゃ株価上がったらしいですね」

私「でも平岡さん、今期もサンダル参加でしたよ」

打ち上げ参加者「そういえば平岡さんって何株持ってるんでしたっけ」

mtmtさん「8000株。ちなみに山本さんは...」

参加者(こ、この人全部覚えてやがる)

 

2次予選のQhapaq vs たぬき戦にて

たぬき「ちょっとたぬきが悪くなってきたかも」

私「Qhapaqの評価関数は良くなってきてます。このままHER○Zの株価並みに上昇してくれれば大成功です」

観戦者(名前失念)「30000超えたらMateですね」

平岡さん「それ安定してないやつやん」

(たぬきが唐突に河童玉の頓死を発見。その後Qhapaqも大反省)

私「hrokてめえええええええええええ」

 

修正前の間違った原稿も置いときます。

設営日から数えて大会2日目=一次予選ってのが何処かで飛びぬけ、

大会2日目=二次予選と勘違いした様子......

2次予選のQhapaq vs たぬき戦にて

たぬき「ちょっとたぬきが悪くなってきたかも」

私「Qhapaqの評価関数は良くなってきてます。このままHER○Zの株価並みに上昇してくれれば大成功です」

観戦者(名前失念)「30000超えたらMateですね」

平岡さん「それ安定してないやつやん」

(たぬきが唐突に河童玉の頓死を発見。その後Qhapaqも大反省)

私「hrokてめえええええええええええ」

---その後、2次予選後の打ち上げ---

私「と、いう暴言を吐きましたが、敬愛する平岡さんの財産形成のためにもHEROZの株価は高みを極めて欲しいですね」

打ち上げ参加者「平岡さんって何株持ってるんでしたっけ」

mtmtさん「4000株、ちなみに山本さんは...」

参加者(こ、この人全部覚えてやがる)

 

入賞スピーチの焼き直し:

本大会では決勝リーグでクラスタの準備が間に合わなかったりしたことをお詫び申し上げます。同時に、便宜を図ってくれた運営および視聴者の皆様に感謝申し上げます。

今回のQhapaqはそれなりに強くできたと思っていました。特に4月なんて本当に地獄でした。桜前線を観る代わりに評価値推移の前線を眺め、5月の旅行先を悩む代わりに飛車の行き先を決めることを悩むのは本当にクソゲーで、私はこんなクソゲーは一日でも早く滅んで欲しいと思っています。

しかし、私はこのクソゲーが大好きです。指す人や観る人をドキドキさせる力が将棋にはあります。そして、その魅力の運び手は400年前の名人であり、今のプロでありココで私と凌ぎを削ったライバルたちです。だから、私はみなさんが大好きです。

ですが、Qhapaqを倒した者共を私は決して忘れません。次こそは報復します。そのために、二つのお約束をします。一つは、Qhapaqをもっと強くして持ってくること、そしてもうひとつは私自身が強い将棋指しになって帰ってくるということです。Qhapaqにはまだ大きな弱点があります。開発者の棋力が低いことです。次はこれを乗り越えてみせます。勿論、棋力の高い人を加えて解決するのではなく、Qhapaqの力を使って私を強くすることで解決してみせます。

次の大会、ぜひ、Qhapaqとだけでなく、私とも将棋を指してくれれば幸いです。これからもよろしくお願いします。

 

 

なお、実際はこんなにうまく喋れてはいない。

【締めきりました】技術書典で頒布した電子書籍のweb販売のお知らせ

技術書典4で頒布した「科学するコンピュータ将棋」のweb販売を行います。

締めきりました。注文された方の中で、DLコードが届いていない、

ダウンロードできないなどの不具合がありましたら、お手数ですが

f:id:qhapaq:20180424225620p:plain

までご連絡ください([atmark]は@に変換してください)。

中学生棋士(加藤九段、谷川九段、羽生竜王、渡辺棋王、藤井六段)の棋力をAIに分析させてみた

藤井四段と羽生三冠のどちらが強いか、流行の人工知能に聞いてみましたの拡張版として、中学生棋士5人の棋力をAIに分析してもらいました。

 

本稿は4月22日の技術書典4で頒布する「科学するコンピュータ将棋」の一部分となっております。興味がありましたら、是非イベントにお越しください(本書の宣伝ページは此方)。

中学生棋士の棋力解析の全文は此方のページから閲覧可能です(このデータに加え、対局相手との比較などのデータがあります)。

 

 

【人間の強さは良く解らない】

「藤井六段は羽生竜王より強いか」

「最盛期が最も強かった中学生棋士は誰か」

これらは観る将であれば一度は考えたことだと思われます。藤井六段と羽生竜王の成績は非公式戦で1-1、公式戦では1-0です。現時点では藤井六段が勝ち越していますが、勝率を測定する上では全然足りていません。プロ棋士が年間に戦う数は精々50前後であり、この程度の数だと勝率には10%以上の誤差が付随してしまいます。

しかし、対局数ではなく指した手の数に注目することができれば、データを大幅に増やすことが出来ます。年間にプロ棋士が指す手数は3000手を超えているので、指し手から強さを測定する方法さえ見つかれば、棋士の棋力を少ない誤差で測定することが出来そうです。

 

【そうだAIを使おう】

YSSの開発者である山下氏によって、将棋ソフトによって得られる悪手率(手を指す前の評価値と後の評価値の差から求められる悪い手を指す確率)によって、将棋倶楽部24のレートを悪くない精度で測定できることが報告されています。

www.yss-aya.com/20141107gpw_meijin.ppt

本稿ではこの研究の拡張系として、評価値毎の悪手率を計算しています。粘り強さが重要となる劣勢局面での悪手率、研究の深さが重要となる互角局面での悪手率、詰めの腕が重要となる優勢局面での悪手率を比べることで、中学生棋士たちの棋力を調べてみます。

 

【比較と総評】

f:id:qhapaq:20180420010153p:plain

 

横軸が手を指す前の評価値、縦軸が悪手を指す確率(厳密には手を差した前後での評価値の減少分の平均)です。端的に言って低いほど強いです。以下、各中学生棋士たちの評価です。

 

【藤井六段】
藤井六段の最大の強みは有利になった局面での悪手率の低さです。中学生棋士全員の中でもずば抜けて低いです詰将棋で培った終盤力によって紛れを起こさせないことが上手であると言えましょう。また、-200〜200程度の互角の局面でも、中学生棋士達の中で最も良いスコアをあげています。21世紀の若手棋士よろしく、序盤戦略を相当練り込んでいると言えましょう。逆に不利な局面での粘りは意外なことにも中学生棋士の中で最も悪いスコアが出ています。紛れを求めた実戦的な指し回しを学ぶことが今後の課題となるかも知れません。

 

【渡辺棋王
渡辺棋王は勝勢の局面での指し回しが中学生棋士の中でも一番正確です。玉の固さに関する感覚が優れており紛れにくい終盤戦を展開するのが得意なのだと思われます。一方、自分が不利な局面での指し回しはソフト的にはミスが多いようです。「形勢が悪くなると顔に出てしまう」という本人評を反映した形になってしまっています。

 

【羽生竜王
羽生竜王は全体的にスキがなく流石はオールラウンダーといったところです。特に凄いのが不利な局面での悪手率の低さと対局相手の悪手率の高さです。悪い局面では意図的に変な手を指して紛れを求めなければならないとは言いますが、羽生竜王は自身の悪手率を上げることなく、紛れを求められているようです。羽生竜王の大逆転は羽生マジックと呼ばれますが、悪い局面で正確に指しながら、相手を複雑な局面へと追いやることについては、棋界のレジェンドである中学生棋士たちすらも寄せ付けません。羽生竜王自身はほとんどの棋戦でシードであり、対局相手の平均レートが最も高い棋士の一人であるにもかかわらず、このようなスコアを叩き出せるのは驚嘆の一言に付きます。

 

【谷川九段】
最近の谷川九段には自身が少し有利になった局面での指し回しに難があります。評価値+1500以上の勝勢の局面での指し回しは光速の寄せよろしく盤石ですが、そこに至るまでの構想に苦慮している様子が見て取れます。ただし、不利な局面での粘りは健在であるため、ここ暫くの成績の停滞は序盤中盤の研究の時間が取れなかったことが原因なのではと予測できます。

 

【加藤九段】
加藤九段は不利な局面(特に-400〜-600程度の形勢が傾き始めた局面)での指し回しは羽生竜王と並んで最も優れています。不利な局面でも折れずに戦えるのは歴戦の猛者の証左と言えます。また、勝勢の局面での指し回しも血気盛んな後輩たちと比べ遜色ないものとなっています。加藤九段の最大の弱点は有利な局面でのミス率の高さです。棒銀の名手として名を馳せすぎたゆえに、相手に研究をされてしまっているのかも知れません。

 

【総評】
これらのデータを踏まえ、私が予測する2018年時点の中学生棋士の強さの順位は 藤井六段=羽生竜王>渡辺棋王>谷川九段>加藤九段 です。数字の上では藤井六段の方が羽生竜王より強いのですが、対戦相手の平均レート差を加味すると、勝負はこれからであると予想しています。あくまでソフトの予想(しかも、一般的な下馬評と殆ど差がない)ではありますが、棋風を解析することで時代を作る彼らが今後どのように伸びていくかをこういった形式で解析するのも一興でしょう。

 

【改めて宣伝】

本稿は4月22日の技術書典4で頒布する「科学するコンピュータ将棋」の一部分となっております。興味がありましたら、是非イベントにお越しください(本書の宣伝ページは此方

 第五回将棋電王トーナメントのトロフィーも持っていきます。ガラス製の鈍器です。

技術書典4にてコンピュータ将棋本を頒布します in 4月22日 秋葉原

4月22日に行われる技術書典4にて昨今の将棋ソフトを語りつくす本「科学するコンピュータ将棋」を頒布いたします。約70ページ、700円での頒布を予定(※)しています。

注:電子書籍での販売を予定しています。名刺にQRコードを印刷するような感じです

 

techbookfest.org

【サンプル】

第3章までを此方のページで読むことが出来ます。

 

【詫びDLC(ダウンロードコンテンツ)について】

70ページのうち16ページぐらいを公開しているのに700円というのもきまりが悪いので、WCSC28後に本書購入者を対象に学習用データ(及びソフト)を先行公開いたします。本書に付随するDLCに関する情報は此方からご確認ください

 

【その他アピール事項】(4月17日アップデート)

・会場販売限定ですが、レフェリー割があります

以下の本(名刺)を持ってきた方には200円引き(700円→500円)にて販売いたします(マニア向け補足:割引の重複はありません。お許しください)

Short Coding ~職人達の技法~2007/8/9 Ozy、 やねうらお

Windowsプロフェッショナルゲームプログラミング2002/5/31 やね うらお

ひなた先生が教えるデバッグが256倍速くなるテクニック (Software Design Books) 2008/11/14 やねうらお

ショートコーディング 職人達の技法 2014/3/11 Ozy、 やねうらお

解析魔法少女 美咲ちゃん マジカル・オープン! | やねう解析チーム

やねうらお氏の名刺

Java将棋のアルゴリズム―アルゴリズムの強化手法を探る (I・O BOOKS) 2016/8 池 泰弘

Java将棋のアルゴリズム―アルゴリズムの強化手法を探る (I・O BOOKS) 2007/4/25 池 泰弘

コンピュータ将棋のアルゴリズム―最強アルゴリズムの探求とプログラミング (I・O BOOKS) 2005/2 池 泰弘

池 泰弘氏の名刺(うさぴょんソフトウェア製作所の名刺)

 

・入場は無料です

技術書典は一般参加は無料です。ご安心ください。

 

・電王トーナメントのトロフィーを持っていきます

電王トーナメントのトロフィーの最大の特徴はガラス製ででかくて重いことです。持っていただくのは安全上難しいですが、撮影などを楽しんでいただけると幸いです。

※:会場混雑によってはチラ見になってしまうかも知れません。会場スタッフの指示に従うようお願い申し上げます。

 

【web販売の予定について】

技術書典終了後にwebベースでの販売を予定しています。アマゾンギフトあたりを使うことになると思います。

速読コンピュータ将棋用語【記事募集中】

将棋ソフト開発者をやっていると当たり前に見えてしまう怪しい用語、これを解りやすくするというミッションを受信したのでやってみます。

 

 

 【もっと良い辞書をくれ】

コンピュータ将棋専門用語辞典【寄稿、独自解説など】(できるだけ数学抜きで解説する) - rewritemath’s blog

コンピュータ将棋 レーティング

などがおすすめです。

中の人のボヤキ:(初心者視点で解りやすい記事が増えてきたので、この記事は開発者しか使わなさそうな謎のスラング辞典にするべきかも解らぬ)

 

本稿では受験生御用達の英単語風に、よく出てくるソフト用語を大盤解説語に翻訳していきます。受験生のようなまっさらな気持ちでどんどん覚えていきましょう。

 

【将棋ソフトに詳しいフレンズ、興味があるけど開発者が何を言ってるかわからないフレンズへ】

コメントやら作者twitter(妖怪惑星Qhapaq(@Qhapaq_49)さん | Twitter)で単語を募集しています。なお、作者は大半のコム将棋用語を知っているはずですが、息を吸って吐くかの如くコム将スラングを使い過ぎた結果、どこからが辞書にするべき単語なのかわからなくなってしまっています。

 

大盤解説で出てきそうな話】

評価値:現在何方がどれぐらい有利かを示した指標

評価値がプラスであれば手番側が有利、マイナスであれば手番側が不利であるという判定方法が一般的です。点数については±200以内で互角、200~600ぐらいで有利、600を超えたあたりから優勢で、1200を超えたあたりから勝勢と言われますが、最近のソフト同士の勝負だと400を超えると殆どひっくり返らない感じです。

例文:「現在の局面の評価値は+800です」→「現在の局面は手番側が優勢です。評価値は800点程度のようです」

 

Mate x:x手以内に詰む

25手詰めではないことに気を付けてください。どう逃れてもX手以内に詰むというのが見つかるとソフトはMateを吐いてきます

例文:「Mate +25と出ています」→「25手以内に詰むようです」

 

depth :手を読んでいる深さ

pv :読んでいる手筋

今の将棋ソフトには一部の手を選択的に深く読む機能が実装されています。故に、読みの深さが2種類表示されたりします。また、読み筋のことをちょくちょくPVと呼んだりします。

 例文「現在depth 10/14まで読んでいて、pvは83飛車82香です」→「現在10~14手先まで読んでいるようです。今は▲83飛打△82香打の筋を考えて居ます」

 

multiPV :読んでいる手の種類

multiPVはソフトを使って戦型などを研究するときによく出てくる技です。multiPVの後ろにある数と同じだけの候補手を出してくれます。

例文「multiPV 3で読ませると76歩、26歩、78金が候補になります」→「ソフトが良いと考えている上位3手は76歩、26歩、78金です」

 

Ponder:相手の手番中に読んでる手筋

将棋ソフト用語でのponderは、相手の手番中に相手の指し手を予想して読むことを意味します。殆どのソフトは相手の指し手の予想を1通りに絞り、その手を指した場合についてのみ深く読む作りです。当たれば相手の消費時間分だけ長く手を考えられますし、外れればゼロから読み直しになります。それ故にponderが当たるか否かは勝負を決める上で重要な要素となります。

例文「Qhapaqがponderを当てられ続けていて辛そうです」→「Qhapaqの指し手が相手の読みと当たっているせいで時間攻めを喰らっています」

 

反省、土下座:評価値が急落する様子

ソフトも結構な頻度で勘違いをします。自分が有利だと思っていたソフトが数手先で評価を翻すことを反省、土下座と呼びます。体感的には土下座の方が反省より評価値の下落が大きいことが多いです

 

説得中:ソフトの評価値が割れている状態

評価値が割れることでどちらかの反省 or 土下座が不可避になった時に開発者が良く「説得されろー」と互いを罵り合います。

例文「「nozomiの評価値+400で有利って出てます」「Qhapaqはまだ互いに0ですね」「説得されろー」「説得されろー」」(WCSC27の開発者雑談より。因みにこの後Qhapaqが反省した)

 

ライブラリ:コードが公開されていて改造できるソフト

やねうら王、Apery、技巧が有名。今のソフト開発の爆発的進化を支えているとても偉いソフト達です。

 

チルドレン:ライブラリを使ったソフトの総称

先人が与えてくれた探索部や学習のノウハウを改造して戦っているソフト達の呼び名です。有名どころで言えば、elmo(WCSC27優勝)、たぬき(sdt5優勝)など

 

【ソフトの手法について出てきそうな話】

評価関数:一つ一つの局面に対し、どちらが有利であるかを判別する手段

 

探索部:各々の指し手に対する評価値から、どの手を指すと一番得かを判断する部分

昨今の将棋ソフトを理解する上で恐らく最大の障壁になっている、評価関数と探索部。評価関数も探査部も一緒くたにソフトと呼ぶのは本来適切ではないのですが、用語として広がりすぎているので、評価関数、探索部の意味をそれぞれ簡単に解説する必要がありそうです。

 

ボナメソ:ボナンザメソッド。Bonanzaが使った学習方法です。具体的にはプロ棋士の手を再現できるように評価関数を調整する手法です。

 

雑巾絞り:深い読みで与えられる評価値や指し手に対して、浅い読みの評価値を一致させるようにすることで、評価関数を学習する手法。凄く雑に言えば読みが深くて強いソフトで読みが浅いソフトを教育する超高速指導対局

 

elmo絞り:雑巾絞りの進化形。評価値と勝ち負けの合議で手の良し悪しを求め、それを教え込む超高速指導対局

 

KPPT:よく見る評価関数の形。玉と駒二つの並びに点数をつけて、それの和で盤面の良さを判定します