js26歩の評価関数を公開します and 課金評価関数事業の進捗報告

2022年11月の第3回世界将棋AI電竜戦本戦、及び、 第1回マイナビニュース杯電竜戦ハードウェア統一戦に参加したJust Stop 26歩の評価関数です。定跡無しで飛車を振る、水匠をはじめとした入賞ソフトの多くに振り飛車で倒す、いずれの大会も振り飛車ソフトとしては最高成績を上げる(6位、9位)と2023年2月時点でおそらく最強の振り飛車将棋ソフトであると思われます。ふかうら王(dlshogi)向けの評価関数(model.onnx)とやねうら王に搭載できるNNUE型の評価関数(nn.bin)からなります。ただしnn.binはsqmz関数と同じ中身となっております。

 

ダウンロードはこちらから

github.com

 

深層学習モデルで特定の戦型を指すことを特徴とした評価関数については勝率測定が難しく(互角局面を使うと無意味なものになってしまうが、さりとて平手でやると同じ棋譜ばかりが作られる)強さについてはなんともフワフワした表現になってしまっていますが、大会実績を鑑みるにおそらく強いと思います。お楽しみいただければ幸いです。

 

【課金評価関数について。配布する際のライセンス案を考えました】

大航海時代冒険者が貴族たちに出資を受けて航路を探したのと同じく、皆様から課金を募って評価関数を作りそれを公開するという事業を始めようとしています。

 

note.com

一部の人間に有償で評価関数を売却する仕様上、利用方法にいくつかのルールをつける必要があると考えています、例えば、追加学習したモデルを将棋大会で使ってもいいけど、ほぼ何も学習していないようなモデルを自作モデルとして公開されても困ると言った具合です。

 

将棋AI開発者や利用者のモチベーションを高めることと、課金してくれたユーザの期待を裏切らないことのバランスを取るために「販売してから一定期間については追加学習をしたモデルの公開を禁止する。一定期間経過後についてはCC-BY-SAライセンスとする」というライセンスをつけることを考えています。

 

以下にライセンスの文面案を記載します。ご意見アドバイスありましたらお願いします

 

======以下文面案======

【個人利用向けライセンス】
本学習済評価関数(model.onnx, model.pth)を対局・定跡作成・各種将棋AIの大会にご利用いただけます。ただし、各種ドキュメントファイルやPR文章に本学習済評価関数を使ったことを明記してください。また、本学習済評価関数を追加学習して得られた評価関数についてはその公開を禁止します。

 

【デュアル・ライセンス】
Qhapaq開発チームは、本学習済評価関数を、将棋AI開発の促進と各種将棋AIの大会の競技性の維持の両立を目的とし、A年X月Y日以降は上記個人利用向けライセンスと、下記開発者向けライセンスによるデュアル・ライセンスモデルで提供します。

 

【開発者向けライセンス(A年X月Y日より有効)】
A年X月Y日以降については本学習済評価関数をCC-BY-SA3.0のもとご利用いただけます。詳細は
https://creativecommons.org/licenses/by-sa/3.0/deed.ja
をご参照ください

 

======文面案終わり======

 

最初の販売用の評価関数の学習はまもなく終わる見込みです(自前PCで回してるから遅い遅い)。販売する以上、「買ったけど使えなかったよ」というケースを減らすためにドキュメントやexampleを書く作業を頑張っています(これが案外大変)。使い方わからなかった人はnote経由で返金申請してという運用にしたいと思っていますがnoteの返金期限が24時間なのでできるだけ事前に丁寧な説明を心がけたいところ。