次世代の将棋思考エンジン、NNUE関数を学ぼう(その2.改造/学習編)

前回の記事からかなり時間が空いてしまいましたが、引き続きNNUE関数について議論していきます。 現在、まふ氏が作成したNNUE型の評価関数がQQR(KPPT型)とならび、将棋ソフトの評価関数で最強の座についています。学習パラメタなどについては、まふ氏の解…

次世代の将棋思考エンジン、NNUE関数を学ぼう(その1.ネットワーク構造編)

update 18/06/03 12:00NNUE評価関数とは将棋ソフトの思考エンジン(もとい、局面の良し悪しを評価するための関数)です。NNUE関数は今流行りのニューラルネット(ディープラーニングの小さいやつ)を盤面評価に取り入れており第28回コンピュータ将棋選手権…

Qzilla-Qhapaq-Roll関数(Qzilla9比でレート+50前後)を公開します

表題の通り、今期もコラボ関数を公開します。 Release qhapaq学習機によるコラボ関数群 · qhapaq-49/qhapaq-bin · GitHub qqr_rel.7z が今回の作品です。 関数の正式名称は「クジラのかっぱ巻き関数」です。アルファベット表記ではQzilla-Qhapaq-Roll(略し…

妖怪惑星Qhapaqの定跡も公開しました

此方からダウンロードできます。今回は定跡は2種類あります Release 定跡のページ · qhapaq-49/qhapaq-bin · GitHub 【Qhapaqが考えたWCSC28の定跡のメタゲーム】 WCSCは計算資源が無制限であるため、長い定跡を作るのはリスキーであると考えていました。序…

妖怪惑星Qhapaqの評価関数を公開しました

長らくおまたせ(?)しましたが、WCSC28で7位入賞を果たした妖怪惑星Qhapaqの評価関数を公開しました。 DLは此方からどうぞ Release qhapaqの評価関数群 · qhapaq-49/qhapaq-bin · GitHub qhwcsc28.7zが妖怪惑星Qhapaqの評価関数です。 【レート測定結果】 …

第28回コンピュータ将棋選手権の感想戦(雑談編)

2018.05.08に修正 第28回世界コンピュータ将棋選手権に妖怪惑星Qhapaqとして参加しました。悲願の決勝リーグ進出を達成し、最終的な順位は7位入賞となりました。応援してくれた方、大会を支えてくれた方、大会を楽しんでくれた方全てにお礼申し上げます。…

【締めきりました】技術書典で頒布した電子書籍のweb販売のお知らせ

技術書典4で頒布した「科学するコンピュータ将棋」のweb販売を行います。 締めきりました。注文された方の中で、DLコードが届いていない、 ダウンロードできないなどの不具合がありましたら、お手数ですが までご連絡ください([atmark]は@に変換してくださ…

中学生棋士(加藤九段、谷川九段、羽生竜王、渡辺棋王、藤井六段)の棋力をAIに分析させてみた

藤井四段と羽生三冠のどちらが強いか、流行の人工知能に聞いてみましたの拡張版として、中学生棋士5人の棋力をAIに分析してもらいました。 本稿は4月22日の技術書典4で頒布する「科学するコンピュータ将棋」の一部分となっております。興味がありましたら、…

技術書典4にてコンピュータ将棋本を頒布します in 4月22日 秋葉原

4月22日に行われる技術書典4にて昨今の将棋ソフトを語りつくす本「科学するコンピュータ将棋」を頒布いたします。約70ページ、700円での頒布を予定(※)しています。 注:電子書籍での販売を予定しています。名刺にQRコードを印刷するような感じです techbook…

速読コンピュータ将棋用語【記事募集中】

将棋ソフト開発者をやっていると当たり前に見えてしまう怪しい用語、これを解りやすくするというミッションを受信したのでやってみます。 コンピュータ将棋用語一覧と意味が整理されているサイトをご存知の方は教えて下さい。Wikipediaでも良いです。 — 阿部…

第28回世界コンピュータ将棋選手権の成り行き予想(4/1 ver)

エイプリルフールだし、WCSC28の決勝リーグへ行くソフト予想という全く当たらない類の予想をしても許されるだろうと言うことでダラダラ書いていきます。 「あのソフト無いよー」的なツッコミは多々あると思いますが、全ソフトについて書くと私の工数削減がマ…

学習の最適化に纏わる考察

評価関数の学習をやっている人達における、バッチサイズや学習率に関する話は、 アラサー男子の健康トークのような立ち位置であると言えます。 どういう理屈かはさっぱりわからないですが、100万局面づつ更新しながら10セット学習するのと、1000万局面を1…

最強ソフトの言うことの真逆をやると最弱になるのか検証してみた

今や将棋研究のお供の定番である将棋ソフトですが、その裏で初心者の練習相手としても定番になりつつあるようです。駒の動かし方を覚えた人が次にやるべきなのが数練習をすることであり、数をこなす為のモチベーションを維持する際に、無限に遊んでくれてし…

各種将棋ソフト間での教師データの変換ツールの開発

【もっと良いコンバータを作ってQhapaqの侵略を阻止しよう】 このままだとデータの絆でAperyとYaneuraOuを強くする変換器、略してKizunaAy converter(キズナアィコンバータ)が業界標準になってしまいます。助けて! Aperyとやねうら王の間で未だに教師デー…

apery-qhapaq評価関数(apery sdt5比でR+50くらい?)を公開します

正式名称はapery-qhapaq評価関数。略すならaperypaqと書いて「えいぷりぱーく」または「あぺりぱーく」と読みます。 【DLはこちらからどうぞ】 Release qhapaq学習機によるコラボ関数群 · qhapaq-49/qhapaq-bin · GitHub # aperypaq.7zが今回の関数です。 【…

Qhapaq_conflatedの評価関数と定跡を公開しました

長らくおまたせ(?)しましたが、Qhapaq_conflatedの評価関数を公開しました。河童パーク定跡も同梱してあります。 DLは此方からどうぞ Release qhapaqの評価関数群 · qhapaq-49/qhapaq-bin · GitHub 評価関数の強さについて Qhapaq_conflatedは2秒(4スレ…

第五回将棋電王トーナメントのお礼と本大会でのQhapaqの戦略

第五回将棋電王トーナメントを視聴してくださった皆様、並びに、大会に参加した開発者の皆様にお礼申し上げます。 Qhapaq_conflatedは並み居る強豪を圧倒的幸運(とひと握りの努力)で倒し、5位入賞という大変名誉な結果を残すことが出来ました。 本体のうp…

(棋力)ゼロから始める将棋ソフトを使った戦型探索(解説編、居飛車編)

2017年の升田賞は千田翔太六段が受賞しました。 将棋ファンには今更ではありますが、千田先生はコンピュータ将棋を用いた将棋研究の第一人者でもあります。受賞の原動力となった角換わり腰掛け銀4二玉・6二金・8一飛型は、2015年頃からコンピュータ同士の対…

羽生三冠の通算勝率を5割にするのってプロ棋士のルール的に無理じゃね?

皆様知っての通り、羽生三冠はとても強いです。将棋連盟のホームページによるとこの記事の執筆時点で通算成績は1379-552だそうです。長く現役を続け、かつ、タイトルに近づくほど相手が強くなる中でこの成績をキープするには並々ならぬ努力を続けていること…

ゼロから創る chainerrl を使ったディープラーニングもどき

注:今回の記事は完全にプログラマ向けの解説記事ですソースコードの閲覧、ダウンロードは此方からどうぞ GitHub - qhapaq-49/chainerrl_test: chainerrlを使ったスタンドアロンな強化学習のサンプルです【前回の記事(tensorflow版)】 ゼロから創る tensor…

ゼロから創る tensorflow + reinforcement learningを使ったディープラーニングもどき

注:今回の記事は完全にプログラマ向けの解説記事ですソースコードの閲覧、ダウンロードは此方からどうぞ GitHub - qhapaq-49/tf_reinforcement: tensorflowを使った簡単(300行弱)なreinforcement learning【今回作りたいもの】 囲碁やポーカーのAIで度々注…

レート測定エンジン ELQを使って君も棋力解析をしよう!

藤井四段と羽生三冠のどちらが強いか、流行の人工知能に聞いてみました - qhapaq’s diaryで用いたレート解析機をやっとの思いでリリースいたしましたので、此処に報告いたします。ソフト自体はかなり前にできていたのですが、皆様の利用に耐える形になるのに…

REsolve MUtationエンジンの使い方

ゼロから始める評価関数分解のやり方紹介です。 githubのドキュメントがあまりに貧弱すぎたので、幾つかの具体例を以って使い方をもう少し細かく解説したいと思います。 注:この関数がパクリじゃないか的な議論をするためにREMUを使うことは推奨しません。…

評価関数ファイルの合成、学習元を解析するツールREsolveMUtationエンジンを公開します

todo もうちょっと可愛げのある文章に書き直す WCSC26を制した評価関数elmoとやねうらお氏が人間の棋譜に一切頼らずに開発した評価関数リゼロ関数を1:1で合成した関数がelmoよりも強くなることを発端に、有志による評価関数の合成が密かなブームを迎えていま…

藤井四段と羽生三冠のどちらが強いか、流行の人工知能に聞いてみました

藤井四段がデビュー開始から連勝を重ね、遂に連勝記録を塗り替えたようです。想像を遥かに超える強さに将棋民は大いに盛り上がっています。 ここまで来ると藤井四段がどのぐらい強いか。もう少し俗な言い方をすれば、将棋界の新スター藤井四段と、将棋界のレ…

【今日のゆるふわ出張版】 atcoderのbeginner contest 64に殴りこんでみた話

ponanzaチームがPFNの精鋭を加えてから暫く。競技プログラミング勢をもっとコンピュータ将棋に引き込みたい、それならまずはコンピュータ将棋勢が競技プログラミングに手を出してみるべきだということで、将棋ソフトレーティングサイトの自称上位ランカー(…

シンデレラ定跡に嬉野流(先手のみ)を追加しました

シンデレラ定跡(プロジェクトについてはこちらをご覧ください)プロダクションに新しいアイドルが加わりました。その名も嬉野流(ただし先手番のみ)です。 ダウンロードは此方からどうぞ Release シンデレラ定跡 · qhapaq-49/qhapaq-bin · GitHub 作ってい…

シンデレラ定跡 はじめました

長らく放置されていた戦型毎の定跡を作ってみようプロジェクト(名づけてシンデレラ定跡プロジェクト)が漸く胎動しました。 シンデレラ定跡の名前の由来はシンデレラたちが将棋を指すシリーズ 盤上のシンデレラとは (バンジョウノシンデレラとは) [単語記事…

elmo型学習の特徴と短い持ち時間で強くない理由 in elo河童理論

# elmo-qhapaq将棋理論。略してエロ河童理論ですね elmoの学習部が公開になりました。秘密にしておけば次の大会でも勝てる見込みが高いにも拘わらず、公開してくれた開発者の方には感謝してもしきれない気持ちでいっぱいです。 さて、elmoの学習部の特徴はや…

elmo-qhapaq評価関数(ver1.1)のリリースのお知らせ

タイトルの通り、elmo-qhapaq評価関数(通称エロ河童評価関数)の最新版を作りましたのでアップロードいたします。 Release elmo-qhapaq評価関数(ver 1.1) · qhapaq-49/qhapaq-bin · GitHub 前回からの相違点: version 1.0に比べelmoの棋譜を2万局程度増…