悪用の懸念もあるOpenAIの文章生成言語モデル「GPT-2」最終版リリース

Liam Tung (Special to ZDNET.com) 翻訳校正: 編集部

2019-11-08 11:56

 非営利の人工知能(AI)研究グループOpenAIは、文章を生成する言語モデル「GPT-2」の最終版をリリースしている。OpenAIは2015年にElon Musk氏らが設立したグループだが、Musk氏はすでに同組織を離れている。

 OpenAIによると、新しくリリースされたフルモデルが生成する文章は、信頼性が旧版よりわずかに向上した。

 OpenAIは段階的な公開プロセスの一環として、2月に言語モデルの一部(パラメーターは1億2400万)をリリースした。15億のパラメーターを持つフルモデルの代わりに縮小版を公開したのは、これが危険すぎる上、テロリストや国家の支援を受けたハッカーなど、悪意のある攻撃者に悪用される恐れがあるとサイエンティストらが考えたためだ。

 OpenAIは、GPT-2の悪用の可能性として、誤解を与えるニュース記事、オンラインでのなりすまし、ソーシャルメディア向けの不適切なコンテンツやフェイクコンテンツ、スパムやフィッシングコンテンツの自動生成などを挙げている。

 この言語モデルはこの分野を主導するテキスト生成AIだ。Googleの研究者も「Bidirectional Encoder Representations from Transformers」(BERT)を開発している。Googleはユーザーの検索内容を予測するためにBERTを使用している。

 OpenAIによると、人は15億のパラメーターを持つGPT-2が生成した文章を「説得力がある」と感じたものの、8月に公開した7億7400万のパラメーターを持つモデルと比較した場合、わずかしか向上しなかった。生成された文章を人がどの程度信頼するのか、コーネル大学が調査を実施した。

 OpenAIは、GPT-2を悪用のために「微調整することが可能」だと述べている。ミドルベリー大学のテロ・過激主義・テロ対策センター(CTEC)によると、白人至上主義、マルクス主義、イスラムのジハード主義、無政府主義などを擁護するよう、GPT-2に手を加え、プロパガンダを生成できる恐れがあるという。

 OpenAIは、15億のパラメーターを持つGPT-2リリースと共に公開した文書で、「GPT-2を悪用する動機とリソースを持っている可能性が高い」のは、APT(高度で継続的な脅威)攻撃者だと指摘している。しかしOpenAIは、そうした脅威に対抗するだけのリソースがないことなどから、CTECとコーネル大学の協力を得た。

 一方、OpenAIはより低レベルの脅威について、以前考えられていたほど差し迫った問題ではないとみている。現時点では、GPT-2が悪用された証拠は見つかってないという。

 OpenAIは、15億個のパラメーターを持つGPT-2モデルで生成されたテキストの検出で、検出精度が約95%の検出モデルを開発している。高い数値だが、OpenAIはメタデータベースのアプローチのほか、人間による判断や一般の啓発などを通じて、検出システムをさらに強化する必要があると考えている。

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    従来型のセキュリティでは太刀打ちできない「生成AIによるサイバー攻撃」撃退法のススメ

  2. セキュリティ

    マンガでわかる脆弱性“診断”と脆弱性“管理”の違い--セキュリティ体制の強化に脆弱性管理ツールの活用

  3. セキュリティ

    クラウドセキュリティ管理導入による投資収益率(ROI)は264%--米フォレスター調査レポート

  4. セキュリティ

    ISMSとPマークは何が違うのか--第三者認証取得を目指す企業が最初に理解すべきこと

  5. セキュリティ

    情報セキュリティに対する懸念を解消、「ISMS認証」取得の検討から審査当日までのTo Doリスト

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]