金田一少年の事件簿の犯人当てマニュアル

※ マニュアル自体にはネタバレ要素はありませんが、実践編はネタバレがあります。ご注意ください。

 

金田一少年の事件簿は累計一億部を超えたミステリー漫画の金字塔とも言える作品です。長編漫画だけでも50以上の事件に巻き込まれ、数百人規模の死体と50人以上の犯人の悲しいストーリーを目にしてきた金田一少年ですが、そのストーリーを俯瞰してみると犯人の人選に規則性があることが解ってきます。

 

本稿では小学生時代から金田一を読み続けてきた重度の金田一ヘッズである筆者が金田一の犯人あてをやる際につかうテクニックを、本編のネタバレを含まない形で紹介していきたいと思います。因みに筆者は下記のトリックで犯人当てクイズに十連勝中です。

 

トリック1.異変を発見したヤツが犯人

密室殺人や不可能殺人は登場人物の恐怖を煽る矛であると同時に犯人を守る盾でもあります。しかし、綿密なトリックの中には犯人自らが登場人物を誘導しなければならないものも少なくありません。数ある誘導の中でも最も典型的なのは死体や脅迫状を見つけて大声で叫ぶことです。手元の調査では35件中9件の事件において犯人はトリックなどへの必要性などから死体(またはそれに類するもの)の第一発見者をやっています。犯人探しの王道とも言える技です。

 

トリック2.場を提供したヤツが犯人

計画殺人を行うにあたり地味かつ極めて面倒なのが被害者(+必要に応じて探偵役)を一箇所に集めることです。また、密室殺人や不可能殺人を行うにあたり事件現場特有の仕掛けが重要な役割を持つことは多々あります。こうした背景から金田一たちを集めた人物、部屋割りなどを決めた人物が犯人である可能性はかなり高いです。手元の調査では35件中8件の事件において世話人が犯人をやっています。死体の発見者と違って世話人は一事件につき基本一人なので命中率という観点では一番強力(かつ決まると悲しい)なトリックと言えます。

 

トリック3.色恋沙汰周りの敵討ちを疑う

金田一の犯人の動機の多く誰かの敵討ちなのですが、かなりの確率で男の犯人は女の、女の犯人は男の敵討ちをしています。手元の調査では35件中27件が故人に対する敵討ちであり、故人が個人であるケース(故人が複数居るケースなどを除外)については15−4で性別が異なるケースが多数派です。

 

トリック4.地の利があるやつを疑う

事件現場特有の仕掛けを使った殺人が行われた場合、犯人は現場における地の利があることになります。事前に入り込み調査したという設定もありえますが、例えば、事件現場が屋敷などである場合、犯人がそこに長く滞在している可能性は高いです。容疑者の大半が屋敷に長く滞在してるケースも多いですが、屋敷に初めて来た型の人物はかなり白いです。

 

トリック5.某ライバルが出てくる事件では犯人が口を滑らせる確率が急増する

犯人しか知らないことを口走ってしまい探偵に疑われるのは探偵モノではあるあるですが、金田一シリーズでは意外と少ないです(手元の調査では6件)。しかし、発言ミスによる犯人の発覚は某ライバル殺人鬼が絡む事件になると急増します。手元の調査では5件中4件で本来知らないはずのことを口走ったことが犯人特定の要となっています。トリックの仕様上、発言から犯人を特定させるほうが楽とは言え、ちと雑すぎでは......?

 

トリック6.ビジュアルの悪いやつはだいたい白い

物語の終盤で犯人の可哀想なストーリーを展開していく上でビジュアルに恵まれないキャラは涙を誘えないからなのか犯人である可能性が低いです。おばはんは若かりし頃が綺麗な可能性があるのであんまり白くないですが、おっさんは出場回数(そして死んだ回数)に比べると白いです。昔語りをする必要性から老人は結構な白要素です。

 

トリック7.露骨に怪しいやつは寧ろ白い

こいつが過去を語りだしたら画になるかを意識して、画にならなさそうなキャラの推理は後回しにしましょう。あからさまに電波な人物が過去を語りだして悲壮感が出るでしょうか。一人過去の因縁に浸るシーンが既に描かれてしまっている人物の過去語りは既視感を避けられるでしょうか。金田一シリーズの事件は過去語りまで含めての作品です。トリックと同じように丁寧に扱いましょう

 

トリック8.トリックは被害者と犯人の5W1Hに注目しよう

金田一シリーズでは全貌を解明するのが不可能なトリックが多々現れます(コマ割などの関係で情報が足りない、物理的にそもそもありえない、google検索でひどいがサジェストされる etc)。そこで、トリックの全貌を暴いて犯人を当てようとするのではなく、事件前後の被害者の5W1Hに注目しましょう。死体の消失やアリバイトリックの全貌がつかめなくても、「どうやらここは遠隔操作で行けそう」、「この鍵は突破できそう」と言った要領で被害者と犯人の取りうる経路がわかれば犯人候補を絞り込むことができます



各種トリックの使い方:

外部の環境(トリック2,3,4,6,7)から犯人を絞り込み、犯人候補の事件前後の挙動を詳細に読み解く(トリック1,5,8)ことで事件の全貌を明らかにしていきます。犯人命中率の高いトリック1〜3が主軸に、トリック4〜8でサポートをしていく感じです。

以下に具体例を紹介してきます。Good Luck 名探偵君!

 

実践編:雪鬼伝説殺人事件

注意:ここから先は金田一少年の事件簿R、雪鬼伝説殺人事件のネタバレを含みます! そのため、文章そのものを白抜きにしてあります。



金田一と美雪はうぇぶすれっどが企画するスキーイベントに招待される。イベントにはランダムに選ばれたモニターがやってくる

→ トリック2を使えばこの時点で犯人がイベントの最高責任者(うぇぶすれっど社長)であろうと予想がつきます。イベントが2回も遅延されたという美雪の発言と組み合わせると、どうせ天候を利用したトリックを使うんだろと予想もついてしまいます。

 

・参加者の一人(雲沢)が何者かに襲撃される

犯人の姿が映っていないことを考えると、何らかの仕掛けを使って殺害した可能性がある。イベント運営側の黒度上昇

 

・雲沢が行方不明になる。雪に残った足跡的に全員にアリバイがある。無線機も壊され天候も悪いため、建物に閉じ込められてしまう

天候を利用したアリバイの時点で先程のイベント遅延と組み合わせて犯人が社長であるとほぼ確信できます

 

・二人目の被害者が現場近くの倉庫の棺桶から発見される

→ 死体の発見は社長秘書が行っています。社長と秘書の二択にする気満々すぎひんか? この辺から他の参加者は漫画的にも空気になってしまいます。

 

・社長の命令で被害者の棺桶をしまう。その後、二人目の被害者が死んだふりをしていたのではと言う議論になり、倉庫に戻って棺桶を開けるも死体が消失している

→ 棺桶か倉庫にトリックがあると予想できる。それができるのは運営側だけだし、棺桶をしまう命令をした点を加味するとやはり社長が黒い

 

・二人目の被害者(鯖木)のパソコンから、うぇぶすれっどの過去のイメージガールの炎上事件が発見される

→ 今回は若いおにゃのこの敵討ち。となると犯人は男である可能性が高い。まあ、社長も秘書も男で役には立たないが。

 

・鯖木パソコンを自室で解析している美雪が犯人に襲われ、パソコンが壊される

→ 鯖木のパソコンを美雪の自室で解析していたにもかかわらず、社長はそのパソコンを鯖木のものであると言及する。もう駄目やんこの人

 

・山の上から事件現場のコテージを見下ろして金田一が違和感に気付く

→ コマ割的にトリックの種が見えるかは怪しいが、コテージのギミックを使った何かであることは察しがつきます。コテージのギミックを使える人物となると運営側の人間になるし、遠隔殺人が可能なら社長秘書のアリバイは意味をなしません。

 

予想:社長が犯人。そもそもイベントの成り立ち自体が怪しすぎる。ここまで怪しいと逆に外れてほしくなってくる

 

結果:しっかり社長が犯人で幕を閉じる。炎上事件に巻き込まれたアイドルの彼氏だったのでその復讐をしたかったらしい。因みに雲沢の殺害は雲沢のコテージを遠隔操作でコテージごと氷の池の下に沈めるというやべえやつでした。色々無理があると思う......

 

トリック2が強力に刺さりすぎて事件が始まる前から犯人が確信できてしまいましたが、それ以外にもここで紹介したほぼ全てのトリックが使えるという意味で永字八法的な美しさのある事件でした。多分

技術書典の頒布物をweb販売します【10月4日まで期間限定】

技術書典7で頒布した「科学するコンピュータ将棋」、および「自宅PCではじめる自然言語処理」のweb販売を行います。

販売期間は 2019年10月4日 23:59までです

終了しました。ありがとうございます。 

頒布物のアピール文
techbookfest.org
 

注意:今回は頒布物が4種類あります。お間違えのないようご注意ください。
注意2:NNUE関数の使い方など、将棋本については内容に重複があります。


【おしながき】

科学するコンピュータ将棋LTS版(既刊、コンピュータ将棋の歴史や学習の理論が中心) ...... 700円
立ち読みはこちら(注:技術書典4で頒布した第一版です)

科学するコンピュータ将棋別冊Qha学習 2018(既刊、2018年の流行の学習手法などについて解説) ...... 300円
立ち読みはこちら

科学するコンピュータ将棋別冊 振り飛車特集 2019(新刊、振り飛車の解析と最強の振り飛車ソフトの作り方について解説しています) ...... 300円
立ち読みはこちら

自宅PCではじめる自然言語処理(新刊、自宅PCで可能な自然言語処理技術を纏めたもの) ...... 300円
立ち読みはこちら

技術書典7でコンピュータ将棋本、および、自然言語処理本を頒布します

Qhapaq開発チームは2019年9月22日開催の技術書典7に参加します。良ければ是非足をお運びください。

 

techbookfest.org

 

以下、頒布物について簡単に紹介をさせていただきます。

頒布物は全て電子書籍です。QRコード入りの紙を頒布する形式です

※:これら頒布物について、ネット通販も行う予定です。

 

【頒布物情報】

各種頒布物の立ち読みページはgithubで公開しています(自然言語処理本だけは現在進行形でデスマしているので目次しか出せていませんが)。

https://github.com/qhapaq-49/Kusokappa/releases/tag/wabidlc

 

【(既刊)科学するコンピュータ将棋 LTS版 700円】

コンピュータ将棋に関する基本的な理論を纏めた教科書的な本です。約85ページ

 

【(既刊)科学するコンピュータ将棋別冊 Qha学習 2018年版 300円】

2018年に登場し、今となっては評価関数のスタンダードになったNNUE関数を始め、2018年の将棋ソフトの最新事情を解説した本です。約40ページ

 

【(新刊)科学するコンピュータ将棋別冊 Qha学習 2019年版 振り飛車特集  300円】

将棋ソフトによる振り飛車の解析と強い振り飛車ソフトを作る方法論について解説した本です。約30ページ

 

【(新刊)家庭用PCで始める自然言語処理 300円】

できるだけ少ない計算資源で実現可能をコンセプトに要約や文章生成の解説を行います。具体的には一晩で1万以上のPVを叩き出しQhapaqの公式サイトをダウンさせた要約エンジンIMAKITAと、最近流行りのAttentionの応用を扱います。

 

【各種割引】

イベント中は以下の割引を行います。

新刊を二冊購入された方については100円の割引を行います(600円→500円)

・将棋神やねうら王をお持ちの方については振り駒割を行う予定です

頒布物の購入価格が振り駒で出た歩の数 x 100円になります。(元の購入価格が500円未満の方については x 50円)。皆で先手を取ってQhapaqに沢山お金を払おう!

 

・会場販売限定ですが、レフェリー割があります

以下の本(名刺)を持ってきた方には100円引き、1000円以上購入される方については200円引きとします(マニア向け補足:レフェリー割の重複はありません。お許しください)

Short Coding ~職人達の技法~2007/8/9 Ozy、 やねうらお

Windowsプロフェッショナルゲームプログラミング2002/5/31 やね うらお

ひなた先生が教えるデバッグが256倍速くなるテクニック (Software Design Books) 2008/11/14 やねうらお

ショートコーディング 職人達の技法 2014/3/11 Ozy、 やねうらお

解析魔法少女 美咲ちゃん マジカル・オープン! | やねう解析チーム

やねうらお氏の名刺

Java将棋のアルゴリズム―アルゴリズムの強化手法を探る (I・O BOOKS) 2016/8 池 泰弘

Java将棋のアルゴリズム―アルゴリズムの強化手法を探る (I・O BOOKS) 2007/4/25 池 泰弘

コンピュータ将棋のアルゴリズム―最強アルゴリズムの探求とプログラミング (I・O BOOKS) 2005/2 池 泰弘

池 泰弘氏の名刺

 

【更新履歴】

9.18 頒布物のリストを作成 レフェリー割について記載

【人間の棋譜からの転移学習】最強クラスの振り飛車評価関数 shinderella を公開します

技術書典7の宣伝も兼ねて現在開発中の振り飛車の評価関数を公開します。

その名もshinderella(振デレラ)です。よろしくお願いします。

 

【ダウンロードは此方から】

Qhapaq Research Labのデータベースからダウンロード可能です。

Cute(0815、体感的に変態棋風)、Cool(0825、体感的にオールラウンダー)からお選び頂けます。shinderellaは、やねうら王上で動かせるNNUE形式の評価関数です。やねうら王の導入についてはuuunuuun氏のページなどを参考にしてください。

 

【shinderellaの強さ】

現在公開されている最強の振り飛車関数である、NNUEkaiFや振電改と同等程度の強さであると考えられます(スクショはcuteのもの。coolは測定中)。ただし、W@ndreの中の人氏が言及しているように、振り飛車ソフト間にも相性問題があるので厳密なレーティングは難しいと思われます。

f:id:qhapaq:20190827213110p:plain

KristallWeizenは振り飛車が苦手な傾向

 

f:id:qhapaq:20190827213153p:plain

逆にillqhaやorqhaは振り飛車を許さない傾向にあるようです

 

f:id:qhapaq:20190827215746p:plain

orqhaから学習したのにorqhaよりも振り飛車側の勝率が高くなっている

 

【shinderellaの面白さ】

orqhaやillqhaといった既存の評価関数に対して、人間の棋譜を転移学習させることで作成しています。教師局面数は10万弱であり、学習時間は約3分です。教師が少ないゆえか程よく過学習しており、中々に変態じみた将棋を指してくれるのが特徴です。

あと、shinderella_cuteはorqhaから学習したのにorqha同士を振り飛車の初期局面から戦わせた場合よりも勝率が高くなっています(orqhaミラーでの後手振り飛車勝率は3割未満)。

 

f:id:qhapaq:20190827212747p:plain

32金が好きな傾向にある

f:id:qhapaq:20190827212845p:plain

端歩も好きな傾向にある。時々初手16歩とかもやる

 

【最後に宣伝】

技術書典7ではコンピュータ将棋振り飛車特集本を頒布します。ネット通販もやる予定ですので何卒よろしくお願いします。

将棋ソフトの勝率から見る振り飛車迫害の歴史

振り飛車は不利飛車である。きのこたけのこ戦争の煽り文句で出てきそうなこの文言は今や将棋界の暗黙の了解になりつつあります。

タイトルホルダーを居飛車に独占され、勝率の上でも居飛車に押されプロ棋士にwebニュースで冬の時代到来と言われてしまうなど、振り飛車にとって厳しい時代が到来しています。

さて、人間にとって振り飛車が冬であるように、コンピュータにとっても振り飛車は冬の状態を迎えているのでしょうか。本稿では将棋ソフトの振り飛車の歴史を紐解いていきます。

 

【将棋ソフトの振り飛車の黎明期(1990〜2000年初頭)】

意外にも(?)、この頃の振り飛車は将棋ソフト界隈のエース戦法の一つでした。というのも、当時の将棋ソフトは水平線効果で序盤、中盤の挙動が怪しく、序盤で変な悪手を指させないためには「初手、3手目は76歩、66歩として角交換を避ける」などの特別な処理を人間が逐一組み込まなければならなかったからです。

この頃もプロ棋士の間では居飛車のほうが主流ではあったのですが、能動的に戦型を選びやすい振り飛車のほうが調整が簡単などの事情で振り飛車を得意とする将棋ソフトが多々いました。

この時期無敵を誇った金沢将棋振り飛車を得意戦略としており、大会の大一番などで振り飛車を多用している他、市販版の金沢将棋も最強レベルでは振り飛車を積極的に狙ってきています(uuunuuun氏のレーティングサイトからvs 技巧などの棋譜を閲覧可能)。

この頃の将棋ソフトは評価関数と戦型が密接に関係していたため、戦型の良し悪しを判断するのは難しいですが、振り飛車党のソフトの活躍を加味すれば互角に近い戦いができていたと考えられます。

 

Bonanzaの到来と居飛車の躍進】

コンピュータの序盤戦事情は2009年のBonanzaの公開に伴い大幅に改善されました。Bonanzaは評価関数をプロ棋士棋譜から学んでいるため、様々な戦型への対応が可能であり、序盤の精度はまだまだ荒削りではあったものの、アマチュア有段者でも苦戦する程度の精度を持っていました。その結果、手動調整が難しいという理由で敬遠されていた居飛車の戦型も採択しやすくなりました。

とはいえ、当時のソフトは振り飛車を圧倒できるほど居飛車が上手く指せたわけでもなく、人間による手調整の結果振り飛車を採択することもままありました。事実、渡辺竜王(当時) vs Bonanzaの対局や、清水女流王将(当時) vs あから2010の戦いでは将棋ソフト側は振り飛車を採択しています。

 

強化学習振り飛車の苦難】

将棋ソフトにおいて本格的に振り飛車が迫害され始めるのは電王トーナメント以降、特にAperyややねうら王といった強豪ソフトがオープンソースになってからです。戦型選びの細かい手調整から開放されたことに加え、ユーザ数に立脚したデータ収集が進んだ結果、振り飛車は勝率の上でも居飛車に押され始めてしまいます。2016年頃のAperyでの振り飛車の勝率は後手ノーマル四間飛車で45%弱であり、この頃から開発者間で振り飛車を避けるように定跡を調整する(初手を26歩に固定する)戦略が流行し、大会から振り飛車の姿が激減しました。

 

【絶望の時代へ】

HoneyWaffleなどの振り飛車をコンセプトとした将棋ソフトの登場で振り飛車は完全に絶滅こそしなかったものの、2017年以降も振り飛車の旗色は悪くなり続けています。ソフトがソフト自身の棋譜から学ぶ強化学習が主流になった結果、将棋ソフトは定跡オフでも振り飛車を指さない完全な居飛車党へと転向してしまいました。そして、2017年頃の振り飛車の勝率は後手ノーマル四間飛車で40%前後にまで減少してしまいました。

更に2018年に生まれたNNUE関数によって、より複雑な盤面評価が実現した結果、2019年現在、後手番の振り飛車の勝率は30%を切るレベルにまでなってしまいました。下図はorqha1018で後手ノーマル四間飛車を指し継がせた際の勝率です。30%を切るどころか25%すら切ってしまっています(たややんさんの検証結果を加味すると、流石に勝率が悪すぎる気がしますが、3割を切るのは間違いないと思われます)。

 

f:id:qhapaq:20190825003648p:plain

対局結果スクショ。うそやん

 

f:id:qhapaq:20190825004226p:plain

初期局面スクショ。この局面ですでに後手の勝率は25%ない

 

【纏めと今後の展望】

20年前には将棋ソフトのエース戦略であった振り飛車は今となっては野球の打率並の勝率になってしまいました。将棋ソフトは多様な手を受け入れ戦型の多様化をもたらしてくれると信じていた身としては大変悲しい話です。

 

しかし、盤面評価精度の向上に伴い、振り飛車に特化した盤面評価の効果が顕著になり始めています。振り飛車に特化した関数は数%ではありますが、居飛車党のソフトよりも振り飛車の勝率が高く、更に良いことに、一部居飛車党のソフトには互角以上の戦いをすることさえもできています。今後の改善によっては振り飛車の更なる躍進もあるかも知れません(ないかもしれません)。

 

 

 

【最後に宣伝】

技術書典7で本を出します。お題は「コンピュータ将棋における振り飛車の研究」です。これに伴い現在振り飛車の評価関数を育成しています。現在の時点でorqha1018に対して勝率35%、KristallWeizenに対して勝率50%まで到達しています。振り飛車ソフトの研究というニッチなネタにどの程度ニーズがあるかは解りませんが、宣伝してくれると嬉しいです。

評価関数は今週末 or 技術書典のサークルカット公開に合わせて公開する予定です。よろしくお願いします。

 

f:id:qhapaq:20190825005532p:plain

現在育成中の振り飛車ソフト。正直何を考えているのか理解できない

リレー対局で最強将棋ソフトの三すくみを解消する話

【最強将棋ソフトの三すくみ】

第29回世界コンピュータ将棋選手権(WCSC29)が終了し、入賞ソフトたちの評価関数が公開されました。準優勝のKristallweizenや、初参加+デスクトップPCで7位入賞の水匠、有志作成の最強関数であるillqha4などが公開されました。

様々な関数が公開されれば「どの関数が一番が強いのか」を知りたくなるのが人間の性。ところが困ったことに、今の評価関数は上位の評価関数について三すくみ状態にあるというのです。

三すくみに参加しているのは前述のKristallweizenillqha4、そして2018年末からSOTAに居座っていたorqha1018(illqhaをベースに筆者が改造したもの)です。(因みに水匠、水匠改も同じぐらい強い)

評価関数の表現力が有限である以上、相性問題はあってもいいのですが、最強ソフトを使って検証をしたい人たちにとってはなんとも落ち着きの悪い話です。そこで本稿では三すくみを起こしているソフトたちを殴り倒すことを目指してみます。


【リレー対局】
将棋ソフト同士の相性問題については、WCSC29の覇者であるやねうらお氏による考察が既に存在しています。

yaneuraou.yaneu.com

端的に言えばorqhaは定跡offでは強い一方で特定の戦型を指定した上での対局ではあまり強くないということです。orqhaは少数高精度のデータで学習を行っているため、序盤の戦型選びに特化した作りになっている可能性は高いです。

しかしこれ、言い換えれば序盤に特化した将棋ソフトを作れているとも言えます。それならば、序盤だけorqhaに指させて、終盤を他ソフトに指させればもっと強い将棋ソフトを実現できるのではないでしょうか?


【実験】
というわけで、定跡オフ、1手1秒、スレッド数4で「序盤30手はorqha、それ以降はKristallweizen」というクソコラエンジンを作成し、orqhaと戦わせてみました。

三すくみの図曰く、この状態ではorqhaが勝ち越しそうですが

結果:
[クソコラ] 270 - 227 [orqha] (引き分けは除外。もとい、対局設定をミスってカウントしてくれなかった)

と、クソコラ関数が勝ち越す結果になりました。統計的にはまだ微妙に怪しいレベルですが、やねうら仮説が正しいこと、リレー対局をすれば将棋ソフトがまだまだ強くなるだろうことが示唆されました。


【実験用コード】
こちらからダウンロードできますやねうらお氏が開発中のやねうら王用のpython wrapperの「あやねる」の拡張エンジンとなっています。pythonが自力でかけないと使うのは難しいと思われます。

# リレー対局の有効性が示されたら本家やねうら王にも実装されるかも.....知れません


pythonわからない】
序盤の考察にはorqha、終盤はKristallweizenを使おう(多分 水匠やillqha4もいいぞ!


【技術書典にでます(宣伝)】
次の技術書典にQhapaqも出ます。今回はコンピュータ将棋本(棋譜解析や最弱将棋エンジン開発を中心にした技術を紹介する予定)と機械学習本(Gigazineに掲載された文章要約エンジンIMAKITAなどの機械学習ネタを突っ込んだ本)を頒布予定です。

長文を3行ぐらいで纏めてくれるChrome拡張 IMAKITA on Chromeを作ってみました

半年ぐらい前にGigazineデビューした文章要約エンジンIMAKITAが遂にChrome拡張になって帰ってきました。

 

chrome.google.com

 

唐突ですが皆様は偉い人の長話に苛々したことはないでしょうか。言いたいことは短いのに枝葉をつけた長文を送られるのにウンザリしたことはないでしょうか。

 

そんな皆様の声(?)を受けて、半年前に長文を3行ぐらいで纏めてくれる(厳密には、文章全体の中で特に重要度の高い文を抽出してくれる)エンジン IMAKITAを作ってみました。

https://www.qhapaq.org/imakita/

 

IMAKITAは私の想像以上に好評であり、なんとGigazineにも掲載してもらえました。そして、多くのユーザから「ハイライト機能が欲しい」「逐一サイトにデータを貼り付けるのが大変だ」というアドバイスをいただきました。

 

そこで、IMAKITAをブラウザ用のアプリにすることにしました。使い方は至ってシンプル。テキストを選択して右クリックからIMAKITAを呼び出すだけ。簡単!!

 

【使用例】

ニコニコニュースを参考に、いかがでしたかブログの王道である「綾瀬はるか 恋人」で検索し最初に出たページを圧縮してみました。要約する行数は7行、各々の要約文の長さは10文字以上になるように設定した結果が以下のとおりです。

 

----------

綾瀬はるかの本名や年収は?熱愛中彼氏と結婚?髪型がかわいい – ロバ耳日誌 https://robamimireport.com/ayaseharuka-honnmyou/
綾瀬はるかの本名は?
綾瀬はるかさんの本名は蓼丸綾というみたいですよ.
読み方は「たでまる あや」です.
綾瀬はるかの年収はどのくらい?
綾瀬はるかさんはほぼ毎日テレビに出ていますよね.
CM1本あたりのギャラは4500万円ですから、CMだけで7億2000万円ですよ!
 
 
ドラマや映画にも出ていますから、10億円を超えていると考えられますね.
ちょっと綾瀬はるかさんの髪型画像を集めてみました.
綾瀬はるかさんは前髪を常に短く作るのが特徴ですよね.
童顔の人が真似すると幼くなりすぎてしまうので注意が必要です.

---------

 

本名と推定年収と髪型に関する要約が綺麗に抽出出来ました。彼氏については結論が出ていなかったからかAI様は完全にスキップしてしまいました。

 

【機能について補足】

生成された要約はクリップボードに自動的にコピーすることが出来ます。キュレーションサイトを圧縮して呟くという賽の河原遊びも楽々出来ることでしょう。

 

要約分に対応する文字をハイライトする機能も実装していますが、jqueryの仕様なのかhtmlタグが入っていると上手く機能しません。解決方法知ってる人教えてください><

 

また、本家IMAKITA同様、多言語にも対応しています。英語、フランス語、スペイン語、ドイツ語に対してもテキストから原語を自動で推定し、要約を生成してくれます。

 

形態素解析(文章の単語を区切る機能)の精度が悪いため、恐らく本家に比べると精度がやや劣ります。

 

【ソースコートと論文】

IMAKITA on Chromegithubでコードを公開しています。また、技術的解説文書もアップされています(日本語版の解説記事も書く予定ですが予定は未定ですorz)。