速読コンピュータ将棋用語【記事募集中】
将棋ソフト開発者をやっていると当たり前に見えてしまう怪しい用語、これを解りやすくするというミッションを受信したのでやってみます。
コンピュータ将棋用語一覧と意味が整理されているサイトをご存知の方は教えて下さい。
— 阿部健治郎 (@abeken277) 2018年4月14日
Wikipediaでも良いです。
丁寧な例文ありがとうございます。今後、そういう表現でファンに説明する機会が増えると思います。
— 阿部健治郎 (@abeken277) 2018年4月14日
私のイメージはIT用語辞典。https://t.co/s8gCsLiKui
索引でコンピュータ将棋用語が調べられれば便利です。
【もっと良い辞書をくれ】
コンピュータ将棋専門用語辞典【寄稿、独自解説など】(できるだけ数学抜きで解説する) - rewritemath’s blog
などがおすすめです。
中の人のボヤキ:(初心者視点で解りやすい記事が増えてきたので、この記事は開発者しか使わなさそうな謎のスラング辞典にするべきかも解らぬ)
本稿では受験生御用達の英単語風に、よく出てくるソフト用語を大盤解説語に翻訳していきます。受験生のようなまっさらな気持ちでどんどん覚えていきましょう。
【将棋ソフトに詳しいフレンズ、興味があるけど開発者が何を言ってるかわからないフレンズへ】
コメントやら作者twitter(妖怪惑星Qhapaq(@Qhapaq_49)さん | Twitter)で単語を募集しています。なお、作者は大半のコム将棋用語を知っているはずですが、息を吸って吐くかの如くコム将スラングを使い過ぎた結果、どこからが辞書にするべき単語なのかわからなくなってしまっています。
【大盤解説で出てきそうな話】
評価値:現在何方がどれぐらい有利かを示した指標
評価値がプラスであれば手番側が有利、マイナスであれば手番側が不利であるという判定方法が一般的です。点数については±200以内で互角、200~600ぐらいで有利、600を超えたあたりから優勢で、1200を超えたあたりから勝勢と言われますが、最近のソフト同士の勝負だと400を超えると殆どひっくり返らない感じです。
例文:「現在の局面の評価値は+800です」→「現在の局面は手番側が優勢です。評価値は800点程度のようです」
Mate x:x手以内に詰む
25手詰めではないことに気を付けてください。どう逃れてもX手以内に詰むというのが見つかるとソフトはMateを吐いてきます
例文:「Mate +25と出ています」→「25手以内に詰むようです」
depth :手を読んでいる深さ
pv :読んでいる手筋
今の将棋ソフトには一部の手を選択的に深く読む機能が実装されています。故に、読みの深さが2種類表示されたりします。また、読み筋のことをちょくちょくPVと呼んだりします。
例文「現在depth 10/14まで読んでいて、pvは83飛車82香です」→「現在10~14手先まで読んでいるようです。今は▲83飛打△82香打の筋を考えて居ます」
multiPV :読んでいる手の種類
multiPVはソフトを使って戦型などを研究するときによく出てくる技です。multiPVの後ろにある数と同じだけの候補手を出してくれます。
例文「multiPV 3で読ませると76歩、26歩、78金が候補になります」→「ソフトが良いと考えている上位3手は76歩、26歩、78金です」
Ponder:相手の手番中に読んでる手筋
将棋ソフト用語でのponderは、相手の手番中に相手の指し手を予想して読むことを意味します。殆どのソフトは相手の指し手の予想を1通りに絞り、その手を指した場合についてのみ深く読む作りです。当たれば相手の消費時間分だけ長く手を考えられますし、外れればゼロから読み直しになります。それ故にponderが当たるか否かは勝負を決める上で重要な要素となります。
例文「Qhapaqがponderを当てられ続けていて辛そうです」→「Qhapaqの指し手が相手の読みと当たっているせいで時間攻めを喰らっています」
反省、土下座:評価値が急落する様子
ソフトも結構な頻度で勘違いをします。自分が有利だと思っていたソフトが数手先で評価を翻すことを反省、土下座と呼びます。体感的には土下座の方が反省より評価値の下落が大きいことが多いです
説得中:ソフトの評価値が割れている状態
評価値が割れることでどちらかの反省 or 土下座が不可避になった時に開発者が良く「説得されろー」と互いを罵り合います。
例文「「nozomiの評価値+400で有利って出てます」「Qhapaqはまだ互いに0ですね」「説得されろー」「説得されろー」」(WCSC27の開発者雑談より。因みにこの後Qhapaqが反省した)
ライブラリ:コードが公開されていて改造できるソフト
やねうら王、Apery、技巧が有名。今のソフト開発の爆発的進化を支えているとても偉いソフト達です。
チルドレン:ライブラリを使ったソフトの総称
先人が与えてくれた探索部や学習のノウハウを改造して戦っているソフト達の呼び名です。有名どころで言えば、elmo(WCSC27優勝)、たぬき(sdt5優勝)など
【ソフトの手法について出てきそうな話】
評価関数:一つ一つの局面に対し、どちらが有利であるかを判別する手段
探索部:各々の指し手に対する評価値から、どの手を指すと一番得かを判断する部分
昨今の将棋ソフトを理解する上で恐らく最大の障壁になっている、評価関数と探索部。評価関数も探査部も一緒くたにソフトと呼ぶのは本来適切ではないのですが、用語として広がりすぎているので、評価関数、探索部の意味をそれぞれ簡単に解説する必要がありそうです。
ボナメソ:ボナンザメソッド。Bonanzaが使った学習方法です。具体的にはプロ棋士の手を再現できるように評価関数を調整する手法です。
雑巾絞り:深い読みで与えられる評価値や指し手に対して、浅い読みの評価値を一致させるようにすることで、評価関数を学習する手法。凄く雑に言えば読みが深くて強いソフトで読みが浅いソフトを教育する超高速指導対局
elmo絞り:雑巾絞りの進化形。評価値と勝ち負けの合議で手の良し悪しを求め、それを教え込む超高速指導対局
KPPT:よく見る評価関数の形。玉と駒二つの並びに点数をつけて、それの和で盤面の良さを判定します