Meta、安全で責任あるAI開発を支援する「Purple Llama」プロジェクトを開始

ZDNET Japan Staff

2023-12-08 10:29

 Metaは米国時間12月7日、開発者による責任ある人工知能(AI)の開発を支援するための包括的なプロジェクト「Purple Llama」(パープル・ラマ)を発表した。

Purple Llamaのコンセプトを示すイラスト
提供:Meta

 このプロジェクトの目的は、同社が2月に公開したオープンソースの大規模言語モデル「Llama」を使用する開発者に、サイバーセキュリティー向けのツールや検証、そして入出力のセーフガードを提供することだ。

 同社によると、生成AIのリスクを軽減するには、攻撃(レッドチーム)と防御(ブルーチーム)の姿勢を組み合わせたパープルチームのアプローチが必要だという。プロジェクトの名称はこの考え方に基づいている。

 Purple Llamaではまず、サイバーセキュリティー向けツールおよび検証、入出力のセーフガードを提供し、今後その数を拡充していく。プロジェクト内のコンポーネントはライセンス供与を行い、研究と商用の両方で利用できるようにする。これにより、開発者間の協業と、生成AIの安全性ツールの標準化を推進したい考えだ。

 サイバーセキュリティーに関しては、大規模言語モデル(LLM)について、業界全体を対象にしたサイバーセキュリティーの安全性評価を行い、結果を公開する。これには、LLMのサイバーセキュリティーリスクを定量化するための指標、LLMによる安全でないAI生成コードの提案頻度を評価するツール、LLMが不正なコードを生成しにくくするための対策などが含まれる予定だ。

 また、入出力セーフガードの一環として、開発者が潜在的リスクのある出力を生成しないようにするための基盤モデル「Llama Guard」を公開する。このモデルは、一般公開されている多様なデータセットで訓練されており、リスクや違反の可能性があるコンテンツを検出できる。

 Metaは、7月に同社の次世代版LLM「Llama 2」を公開した際に100社以上と協業しており、今回も多数の企業と協力しつつ、オープンなアプローチを取るという。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    Pマーク改訂で何が変わり、何をすればいいのか?まずは改訂の概要と企業に求められる対応を理解しよう

  2. 運用管理

    メールアラートは廃止すべき時が来た! IT運用担当者がゆとりを取り戻す5つの方法

  3. セキュリティ

    従来型のセキュリティでは太刀打ちできない「生成AIによるサイバー攻撃」撃退法のススメ

  4. セキュリティ

    AIサイバー攻撃の増加でフォーティネットが提言、高いセキュリティ意識を実現するトレーニングの重要性

  5. セキュリティ

    クラウド資産を守るための最新の施策、クラウドストライクが提示するチェックリスト

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]