長文を3行ぐらいで纏めてくれるエンジン IMAKITAを作ってみました

まさかのGigazineデビューをしました。ありがとうございます。現在、鯖の具合がやや悪く503が出るようです。フォームの再投稿で大半は解決しますが、恒久的に動かないなどありましたらご連絡ください。ご不便をお掛けします。

gigazine.net

 

唐突ですが皆様は偉い人の長話に苛々したことはないでしょうか。言いたいことは短いのに枝葉をつけた長文を送られるのにウンザリしたことはないでしょうか。

 

そんな皆様の声(?)を受けて、長文を3行ぐらいで纏めてくれる(厳密には、文章全体の中で特に重要度の高い文を抽出してくれる)エンジン IMAKITAを作ってみました。

https://www.qhapaq.org/imakita/

 

使い方:

・テキストボックスに文章を入れる(日本語は「。」/「!」/「?」、中国語は「。」区切り、英語、スペイン語、ドイツ語、フランス語、ポルトガル語、イタリア語は「.」区切り。日本語のみ改行も区切る機能を試験的に導入中)

・Squeezeボタンを押す

・結果を楽しむ

 

使用上の注意:

・無保証です

・文章が長すぎると落ちます(nginxの仕様と思われる)

・稀にpythonが文字列の処理をしくじるようです

・日本語、英語以外の言語は動作チェック以上のことをしていないので酷い挙動をしているかも知れません

# 何らかの動作不良を起こした方、ご報告いただけると幸いです

 

【使い方の一例】

キング牧師の演説を5行に要約すると

・しかし100年を経た今日、黒人は依然として自由ではない。
・今日、私には夢がある。
・この信念があれば、われわれ は、いつの日か自由になると信じて、共に働き、共に祈り、共に闘い、共に牢獄に入り、共に自由のために立ち上がることができるだろう。
・自由の鐘を鳴り響かせよう。
・われわれはつい に自由になったのだ!」。

 

になります。英語原文だと

 

・But one hundred years later, the Negro still is not free.
・And they have come to realize that their freedom is inextricably bound to our freedom.
・It is a dream deeply rooted in the American dream.
・Let freedom ring from every hill and molehill of Mississippi.
・From every mountainside, let freedom ring.

 

となります。論文、演説、ニュースあたりが得意なようです。逆に[1]のような記号が入ってしまうwikiや小説の類はあまり得意ではないようです。

 

上手く行った一例を挙げるとDeepMind社が出したAlphaZeroの論文

 

We apply AlphaZero to the games of chess and shogi as well as Go, using the same algorithm and network architecture for all three games.
In chess, AlphaZero first outperformed Stockfish after just 4 hours (300,000 steps); in shogi, AlphaZero first outperformed Elmo after 2 hours (110,000 steps); and in Go, AlphaZero first outperformed AlphaGo Lee (9) after 30 hours (74,000 steps).
In Go, AlphaZero defeated AlphaGo Zero (9), winning 61% of games.
In chess, AlphaZero defeated Stockfish, winning 155 games and losing 6 games out of 1,000 (Fig.
In shogi, AlphaZero defeated Elmo, winning 98.

 

と要約してくれます。

 

アルゴリズムについて】

AI屋の受けが意外と良かったのを受けて、現在論文執筆中です。ご意見、アドバイス、質問などお気軽にお願いします。