OpenAI、安全対策の最新情報を公開--従業員の内部告発を受け

Sabrina Ortiz (ZDNET.com) 翻訳校正: 佐藤卓 吉武稔夫 (ガリレオ)

2024-07-24 09:32

 生成人工知能(AI)モデルの急成長に関しては、安全性が最大の懸念事項だ。だが、OpenAIの安全対策について複数の従業員が提出し、The Washington Post(WP)が入手した7ページに及ぶ内部告発状は、こうした懸念をさらに高めるものとなっている。そこでOpenAIは、同社の安全対策に関する最新情報を一般に公開し始めた。

 OpenAIは米国時間7月23日、「X」(旧Twitter)に連続で投稿し、「当社が業務の中でどのように安全性を優先しているか」を説明した。このスレッドには、最近の主要な取り組みや進行中のプロジェクトの最新情報が記されている。


 OpenAIはまず、2023年12月にベータ版として初めて公開した安全性計画「Preparedness Framework」を取り上げた。このフレームワークは、OpenAIが同社のフロンティアAIモデルの安全性を確保するために講じるさまざまな予防策を規定したものだ。例えば、さまざまな指標についてモデルの評価をスコアカードという形式で示し、リスク安全性レベルが「Medium」(中程度)を超えた場合は新しいモデルを公開しないといったことが定められている。

 また、OpenAIやその関係者がAIの進歩を分類し、追跡するのに役立つ「レベル」の策定に積極的に取り組んでおり、その詳細を「間もなく」発表する予定だと、同社は記している。

 次に、OpenAIは「Safety and Security Committee」(安全セキュリティ委員会)に関する最新情報も公表した。この委員会は、同社の業務に対するチェックアンドバランス(抑制と均衡)をさらに向上させるために、取締役会が5月に設置したものだ。同社によれば、技術やポリシーの専門家を含む同委員会による精査は現在進行中で、精査が終わり次第、今後予定している追加の対策について詳細を発表するという。

 最後に、OpenAIは内部告発者に関するポリシーについて取り上げ、「保護される通報をする従業員の権利を保護する」と述べている。また、AIに関する対話を促進するため、従業員の退職手続きを改変し、会社に対する誹謗中傷禁止の条項を削除したと記している。

 OpenAIによる一連の投稿があったのは、内部告発状を受けて一部の米議員がOpenAIに安全策に関するデータを開示するよう要求したわずか1日後だ。内部告発状で主に指摘されているのは、従業員が技術的なリスクを適切な当局に警告するのをOpenAIが妨害していたことや、内部告発者への補償に関する連邦政府の権利を従業員に放棄させていたことで、Xの投稿はこの両方に対応するものとなっている。

提供:Getty Images/Andriy Onufriyenko
提供:Getty Images/Andriy Onufriyenko

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    Google Chrome Enterprise が実現するゼロトラスト セキュリティの最新実情

  2. ビジネスアプリケーション

    ITSMに取り組むすべての人へ、概要からツールによる実践まで解説、「ITSMクイックスタートガイド」

  3. セキュリティ

    あなたの会社は大丈夫?--サイバー攻撃対策として必要な情報セキュリティの早分かりガイドブック

  4. ビジネスアプリケーション

    業務マニュアル作成の課題を一気に解決へ─AIが実現する確認と修正だけで完了する新たなアプローチ

  5. セキュリティ

    いまさら聞けないPPAPの問題点、「脱PPAP」を実現する3つの手法と注目の"第4のアプローチ"とは

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]