東大(柏キャンパス)でコンピュータ将棋のセミナーをやります

嘗て物理を学んだ柏キャンパスに凱旋できるとは感慨深い......

 

www.issp.u-tokyo.ac.jp

 
日程 : 2019年1月28日(月) 16:00 - 17:00
場所 : 東大柏キャンパス物性研究所本館6階 第5セミナー室 (A615)
注:柏キャンパスです。千葉です。駅から遠いです。徒歩だと20分位掛かります
注:誰でも参加できます。よろしやす
 
【講義の内容】
コンピュータ将棋の数理をお題にゲームAI開発に殴り込む方法を紹介したいと思います。数学レベル的には大学生〜大学院生を主な対象としています。
 
昨今のAlphaZeroなどの躍進で、機械学習強化学習を知っている人が増えている一方で、問題への優れた知見(例えば将棋の有段者であるとか)を持つ人や、高度な数学を使いこなせる人がAI開発に乗り込むのには未だ大きな課題が残っています。
 
私が特に足りていないと感じているのは、AI開発における水面下の戦いに関する情報です。水面下の戦いは悪く言えばマニアックですが、マニアックだからこそ、多様な人材が多様なスキルを駆使して殴り込む余地があるとも言えます。
 
そこで本公演ではQhapaqがこれまで水面下で使ってきた小技を中心に、コンピュータ将棋に潜む豊かな技術課題を紹介していきたいと思います。
 
 
【スライドのサンプル】
# 既に60ページぐらい創っていますが現在未だ改良中です
 

長文を3行ぐらいで纏めてくれるエンジン IMAKITAを作ってみました

まさかのGigazineデビューをしました。ありがとうございます。現在、鯖の具合がやや悪く503が出るようです。フォームの再投稿で大半は解決しますが、恒久的に動かないなどありましたらご連絡ください。ご不便をお掛けします。

gigazine.net

 

唐突ですが皆様は偉い人の長話に苛々したことはないでしょうか。言いたいことは短いのに枝葉をつけた長文を送られるのにウンザリしたことはないでしょうか。

 

そんな皆様の声(?)を受けて、長文を3行ぐらいで纏めてくれる(厳密には、文章全体の中で特に重要度の高い文を抽出してくれる)エンジン IMAKITAを作ってみました。

https://www.qhapaq.org/imakita/

 

使い方:

・テキストボックスに文章を入れる(日本語は「。」/「!」/「?」、中国語は「。」区切り、英語、スペイン語、ドイツ語、フランス語、ポルトガル語、イタリア語は「.」区切り。日本語のみ改行も区切る機能を試験的に導入中)

・Squeezeボタンを押す

・結果を楽しむ

 

使用上の注意:

・無保証です

・文章が長すぎると落ちます(nginxの仕様と思われる)

・稀にpythonが文字列の処理をしくじるようです

・日本語、英語以外の言語は動作チェック以上のことをしていないので酷い挙動をしているかも知れません

# 何らかの動作不良を起こした方、ご報告いただけると幸いです

 

【使い方の一例】

キング牧師の演説を5行に要約すると

・しかし100年を経た今日、黒人は依然として自由ではない。
・今日、私には夢がある。
・この信念があれば、われわれ は、いつの日か自由になると信じて、共に働き、共に祈り、共に闘い、共に牢獄に入り、共に自由のために立ち上がることができるだろう。
・自由の鐘を鳴り響かせよう。
・われわれはつい に自由になったのだ!」。

 

になります。英語原文だと

 

・But one hundred years later, the Negro still is not free.
・And they have come to realize that their freedom is inextricably bound to our freedom.
・It is a dream deeply rooted in the American dream.
・Let freedom ring from every hill and molehill of Mississippi.
・From every mountainside, let freedom ring.

 

となります。論文、演説、ニュースあたりが得意なようです。逆に[1]のような記号が入ってしまうwikiや小説の類はあまり得意ではないようです。

 

上手く行った一例を挙げるとDeepMind社が出したAlphaZeroの論文

 

We apply AlphaZero to the games of chess and shogi as well as Go, using the same algorithm and network architecture for all three games.
In chess, AlphaZero first outperformed Stockfish after just 4 hours (300,000 steps); in shogi, AlphaZero first outperformed Elmo after 2 hours (110,000 steps); and in Go, AlphaZero first outperformed AlphaGo Lee (9) after 30 hours (74,000 steps).
In Go, AlphaZero defeated AlphaGo Zero (9), winning 61% of games.
In chess, AlphaZero defeated Stockfish, winning 155 games and losing 6 games out of 1,000 (Fig.
In shogi, AlphaZero defeated Elmo, winning 98.

 

と要約してくれます。

 

アルゴリズムについて】

AI屋の受けが意外と良かったのを受けて、現在論文執筆中です。ご意見、アドバイス、質問などお気軽にお願いします。

AlphaZeroに投了宣言しないといけないかも知れない

AlphaZeroの論文が出てきました。arxivに出してた論文はイケてなかったですが今回のはイケてます。

 

前回の論文に対しては今の御時世でWCSC27のelmoに勝ったぐらいで convincingly defeated a world champion program とか言わないでよとか、投了の基準が900点なの意味がわからんとか、定跡はどうしたのかとか、棋譜がないのはどういうことかとか散々な評価をした記憶があります。

 

が、なんと今回は棋譜があります。しかも羽生竜王棋譜コメを貰ったようです。棋譜の公開に伴い、戦型の分布も明らかになりました。Zero言いながらちゃんと居飛車を指します。WCSC28でCrazyShogiも矢倉組んでたので驚くほどではないかも知れません。

 

そして、棋譜の公開と同じくらいイケてるのがaperypaq(Apery-Qhapaq関数、略してaperypaq。2017年末から2018年頭ぐらいにかけてsotaだった)を相手にも対局をしていることです。というのも、AlphaZeroとやねうら王+KPPTとでは探索も評価も異質であるため、AlphaZeroとやねうら王系列のレートを同じ土俵で扱って良いのか解らなかったからです。

 

QRLのレーティングではelmoとaperypaqのレート差は170程度、AlphaZeroとelmoのレート差が(勝率91%、400ちょい。なおelmoもaperypaqも探索部のバージョンが4.79にあがっている)なので、AlphaZeroとaperypaqのレート差は230程度となり、AlphaZeroの勝率は80%程度と予想されます。aperypaqを相手にした勝率は図でしか与えられていませんが

 

f:id:qhapaq:20181207215404p:plain

 

こんな感じになっており、図の長さから測定すると約88%(勝率から換算されるレートはaperypaq+340)程度の勝率であると推測できます。測定誤差の範囲かもしれませんが、KPPT同士の対局で強くなってもAlphaZeroに対する勝率があまり上がらないことが示唆されています。

 

個人的にそれに輪をかけてきな臭いのが先手の圧倒的な勝率の高さです。今のコンピュータ将棋が先手ゲーであることは間違いないですが、先後のレート差は精々50程度(先手6割行かないかなぐらい)です。しかし、AlphaZeroの先手は後手に比べてレートに換算して100程度の上昇を果たしています。未だ我々が知らないだけで将棋は想像以上に先手ゲーなのかも知れません。AlphaZero同士の対局での先手勝率が知りたい!!

 

さて、こうなるとorqhaやnnuekai7がelmoに対して90%前後の勝率を出していたとしても、AlphaZeroにはすり潰されてしまう危険があります。後手番なんて特に危ないでしょう。

 

が、このまま引き下がるのも悔しいので手元に潜ませているもっと強いorqha(レートnnuekai7+40ぐらい)の棋譜を公開します(ロタさんありがとう!)。orqhaでもelmoに9割は勝ちます。しかもTPUを買わなくてもサクサク動く。凄い!

 

CPUとTPUの差とか電気代とか学習コストとかを考えるとAlphaZeroの convincingly defeated a world champion program はある程度は話を盛っている気がしますが、前回の論文と違って今回の論文を読んだ感じ、予算度外視で戦えばAlphaZeroが勝つだろうと言わざるを得ません(前の論文の時はそこまで強そうじゃなかったんですが)。即ち相手としてAlphaZeroは追わねばならない存在なのだなと感じました。お見事。

 

【余談】

視力の良い人なら気付くかもしれませんが、前回の論文ではelmoがElmoとtypoされていましたが、今回の論文でもaperyqhapaqがaperyphapaqとtypoされています。あとelmoもElmoのままです。AlqhaZEroェ......

 

これを機にコム将棋海外勢が増えたら良いなと思い、将棋ソフト導入wikiを創ってみました。良ければ編集よろ

コンピュータ将棋wiki強化月間開始のお知らせ

平素よりQhapaq Research Labをご愛顧いただきありがとうございます。

 

コンピュータ将棋の情報を纏めるべく運用を開始したwikiですが、現状記事が集まらなくて苦慮している状態です。

 

特に大きな問題となっているのは、各ソフトの基本情報が纏めきれていないことです。より具体的には、各ソフトが何処でダウンロードできるかや、各ソフトの歴代成績、アピール文のリンクが足りていません。

 

コレがあるだけでも大分、情報量が変わってくる(そして、将棋ソフトに興味を持ってくれた人の役に立つ)と考えています。ソフトの解説を書こうとすると難しくて手が止まってしまう(かくいう私もだ)かもしれませんが、情報を纏めるでよければ敷居は大分下がるでしょう。

 

そこで、コンピュータ将棋wikiの強化月間と称し、10月30日までに将棋ソフトの情報を書き入れてくれた人にamazonギフト券によるギャラを支払うことにしました!

 

【注意】

amazonギフトのメール形式以外での支払は対応していません

・大会出場ソフトではないソフトについてはギャラ支払の対象外です

・最初に必要なリンクを全て揃えた人にのみギャラが支払われます。書くなら一度に書きましょう

wikiのコンフリクトは保証の対象外です。お許しください

・1ソフトに付き200円のギャラが出ます

・既に必要なリンクが揃っているソフトも対象外です

・纏めて支払を行いたいため支払が遅れる可能性があります

 

【記事の書き方】

例:Ponanzaについて書くとこんな感じになります

・コンピュータ将棋wiki上でユーザを作ってください

・コンピュータ将棋wikiのアカウントにギャラ支払用のメールアドレスを登録してください

・開発者の名前、大会成績、開発者webページヘのリンク、アピール文章へのリンクを将棋wiki上に書いてください

・開発者のwebページは代表開発者(開発者名の一番最初に書かれてる人)だけでokです。

・大会成績、アピール文は直近の6大会分まででokです(6回以上参加してないソフトについては全部書いてください)

・将棋ソフト一覧の後ろにある*印を除去してください

・記事を執筆した旨を管理者のメールアドレス

f:id:qhapaq:20180424225620p:plain

までご連絡ください(私自身もwikiの履歴は見ますが、見落とす可能性も高いので申告していただいたほうが確実です)

 

【その他】

・既に記事を書いてくれた方

生まれたばかりの胡散臭いwikiの執筆に時間を費やしてくれた方々にこそ一番感謝をするべき、ということで、遡ってのギャラの支払をする予定です。ギャラの額は記事によって変わる予定ですが、兎に角支払います。履歴を遡るのが困難であるため、やはり連絡頂けると助かります。

 

・解説文章

解説文にもギャラが出るかも知れません。ただし時価です。ハイテク株依存ですし、額も保証できません。申し訳ないです。

 

・なんでこんな企画をやるのか

理由1:wikiを触るという経験を皆様にしてもらいたいから

理由2:技術書典の泡銭を使いたいから

理由3:ソフトの紹介文を書きたいけど、ソフトの情報(アピール文とか大会成績とか)を調べるのが面倒だという人(私含む)が少なからず居ると思うから

【10月25日まで】技術書典5で頒布した科学するコンピュータ将棋シリーズのweb販売を行います

締めきりました。ありがとうございます。

 

技術書典5で頒布した「科学するコンピュータ将棋」のweb販売を行います。

 

頒布物のアピール文

techbookfest.org

 

注意:技術書典4で頒布した科学するコンピュータ将棋を購入された方(現地、web販売問わず)は、科学するコンピュータ将棋LTS版は無料でアップデート可能です。頒布したDLサイトに最新のLTS版が置かれています。

 

注意2:今回は頒布物が2種類あります。お間違えのないようご注意ください。

注意3:圧縮形式の問題で一部環境でファイルが回答できないという問題がありました。お詫び申し上げます(現在は解決しているようです)

 

 

 

【おしながき】

科学するコンピュータ将棋LTS版(コンピュータ将棋の歴史や学習の理論が中心) ...... 700円

立ち読みはこちら(注:技術書典4で頒布した第一版です)

 

科学するコンピュータ将棋別冊Qha学習(最新のライブラリの導入や、今流行している学習手法の動かし方が中心) ...... 300円

立ち読みはこちら

 

【お買い求め方法】

1.amazonギフトメール(メールタイプ)をお送りください送り先は

f:id:qhapaq:20180424225620p:plain

です

 

2.お買い求めいただく冊子をメッセージに添えてください

今回は700円の既刊、300円の新刊の2種類が有ることに注意してください。

 

3.アマゾンギフトのレスポンス機能を経由してDLコード、および、パスワードをお送りします。

注意:アマゾンギフトのレスポンスは一度しか打ち込めず、購入者の連絡先は私の方では解らない仕様です。私の操作ミスなどにより、正しくデータが届かなかった方は、お手数ですが上記メアドまでご連絡ください。

 

4.お問い合わせの際にはamazonギフト購入時の注文番号を添えていただけるとより迅速な対応が可能です

 

皆様、よろしくお願いします!

今の将棋ソフトはAlphaZeroを超えている件

AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニング強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。

 

人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-2-8で破ったAlphaZero。elmoとのレート差は約400。コンピュータ将棋も終わった。

 

......と思ったかも知れません。あの時は。

 

しかし、AlphaZeroの論文(2017年12月発表)から1年も経たないうちその神話は終焉を迎えました。

 

レーティングサイト(/)のレーティング表からもお察しの通り、今の将棋ソフトのレーティングはelmo+400ぐらいの値が出ています。

 

f:id:qhapaq:20181006174130j:plain

 

orqha0926はorqhaの最新バージョン(公開版orqhaに対してR+50くらい)です。測定者はロタさん、棋譜こちらからダウンロードできます。勝率88%。素のレートでいえばAlphaZeroより40程度低い値です。しかし、原著論文は

 

・AlphaZero(TPU)とelmo(CPU)の計算資源は費用比較だとAlphaZeroがかなり有利

・AlphaZeroの試合回数が100しかない(orqha vs elmoだって途中経過では156-1-14(91%)ぐらいの勝率は出てた)

・投了値がなぜか-900になっていて、終盤戦が出てこない

・elmoをElmoとtypoしてる

 

と言った問題点を抱えています(その代わりにorqhaの棋譜は持ち時間が大分短いわけですが)。

 

勝率差がここまで詰まっているのを鑑みれば、ハードの違いを加味すれば今の最強のソフトはまず間違いなくAlphaZeroより強いでしょう。

 

【以下、プロレス的な煽り文】

DeepMind恐れるに足らず。TPUにいくら使ったか知りませんが、その覇権とやらを打ち崩すのに6コア12スレのPCがあれば十分です。

ブレイクスルーだ、技術的失業、シンギュラリティだと宣いますが、巨人の肩を甘く見るからこういう目にあうのです(まあ、orqha自身がやねうら王、NNUE、illqhaの肩に乗ってるのは公知の事実ですしの)。

どうでしょう、DeepMindに材料開発部門ができたら私を雇ってみませんか?

 

【追記:露骨な宣伝】

AlphaZeroを恐らく超えているだろうNNUE関数のorqha。その開発者によるコンピュータ将棋の教科書が技術書典で頒布されます。

 

アピール文のページはこちら:

qhapaq.hatenablog.com

イベントのページ:

https://techbookfest.org/event/tbf05
https://techbookfest.org/event/tbf05/circle/53170003

 

良ければ足をお運びください。web通販も予定しています!

【技術書典に】コンピュータ将棋は戦国時代から存在していた!? 〜消えた酔象の謎〜【出ます】

一瞬バグかと思いましたが、なんと山口さんが記事を投稿してくれました。というわけで、タイトルの通りの記事を技術書典で頒布します。以下、頒布に至るまでのストォリイ。

https://twitter.com/ymg_aq/status/985850934944149506

 

 

山口さんとは囲碁ソフトの最強格であるAQの開発者であり、WCSC28で準優勝した強豪将棋ソフトPALの開発者でもあります。平たく言えば超大物プログラマです。

 

素晴らしいプログラマが記事を書く気になってくれてるのは大変ありがたいことなので、「是非お願いします。ギャラとしては最低でも肉を出します。ハイテク株で儲かりましたし」とリプライを送り「流石にムーは冗談やろ」と思いながら夏休みを過ごしてから暫く。

 

10月のある日、我々のもとに一つの怪文書が届いたのです。

 

(以下、記事の概要より、引用/抜粋)

コンピュータによる将棋ソフトのはじまりは 1975 年とされている。ところが実際にはその遥か以前、戦国時代からコンピュータ将棋は存在したのだという。はたしてコンピュータ将棋は何の目的でつくられたのか?
コンピュータと将棋を結びつける「象」の正体とは?我々は駒のルーツを追う過程で、コンピュータ将棋、さらには将棋の歴史の核心に迫った。その詳細をここにご報告しよう。

※:本コラムには科学的内容は含まれません

 

マジで記事が投稿されたのです。しかも、本当に醉象ネタで。

恐ろしいことに9ページ、約1万文字の超大作です。国語教科書の定番オブ定番、山月記ですら6500文字ぐらいなのに。走れメロスが約10000文字なのでメロスと同じぐらいか。何が起こってるんだ囲碁ソフト界。

 

というわけで、この本も技術書典に出ます。出します。何としてでも出します。

Qha学習を購入された方に無料で特典として付けます。単品では一応100円としておきます。

 

読んだ個人的な感想としては、将棋の歴史記事については「おおっ」と思う他、開発者的な知識に基づいた考察(?)とワードチョイスには嫉妬の念を抱かずにはおれませんでした。

 

本書が売れるほど山口さんにご馳走する肉のクオリティーが(多分)上がります。

 

 

名コラムは一日してならずというべきなのか、なぜムーを推し!?というべきなのか。

 

【リンク】

技術書店に関する本団体のアピール記事:

qhapaq.hatenablog.com

 

技術書典のイベントのページ:

https://techbookfest.org/event/tbf05
https://techbookfest.org/event/tbf05/circle/53170003

 

https://twitter.com/ymg_aq/status/985850934944149506