Elon Musk氏が支援する非営利の人工知能研究グループのOpenAIは米国時間2月14日、「大規模な教師なし言語モデル」の「GPT-2」に関する情報を明かした。OpenAIによると、GPT-2は読解力や質問応答、要約などに関して、非常に優れたスキルを持っているという。
文章の冒頭を入力すると、かなり説得力のあるサンプルが返ってくる。800万のウェブページのデータセットで訓練されたGPT-2は、与えられたテキストの文体や内容に適応する。
OpenAIはいくつかの例を提示している。たとえば、「Miley Cyrusさんが今日、ハリウッド大通りのAbercrombie and Fitchで万引きをして捕まった」という例文を入力した例では、「19歳の同歌手が警備員に連れられて店から出る様子がカメラに写っている」で始まるサンプルが返ってくる。
「Miley Cyrusさんが今日、ハリウッド大通りのAbercrombie and Fitchで万引きをして捕まった」という例文を入力した例では、「19歳の同歌手が警備員に連れられて店から出る様子がカメラに写っている」で始まるサンプルが返ってくる。
提供:OpenAI
GPT-2がきっかけとなって、AI執筆アシスタントや高性能な音声認識システムが誕生するかもしれない。
しかし、ボットで生成されたツイートやディープフェイク動画の問題に直面している時代において、OpenAIは、悪意ある人間たちが自動化されたテキストジェネレータを使って「欺瞞的な言葉や偏見に満ちた言葉、不適切な言葉を大量に」生成することを不安視している。具体的には、誤解を招くニュース記事、オンラインでのなりすまし、ソーシャルメディア上の不適切なコンテンツ、スパムおよびフィッシングコンテンツが大量に生成されるおそれがある。
そうした理由から、OpenAIはGPT-2の研究に関する詳細情報をすべて公開するつもりはないと述べた。その代わりに、ほかの研究者が試せるように、非常に小規模なモデルと技術文書を公開するという。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。