OpenAI、AIトレーニング用データセットを構築するパートナーシップを発表

ZDNET Japan Staff

2023-11-10 10:49

 OpenAIは米国時間11月9日、人工知能(AI)モデルのトレーニングに用いるデータセット構築に向けて、広範な協力を求める「OpenAI Data Partnerships」を発表した。さまざまな組織の協力を得て、オープンソースおよびプライベートのデータセットを構築する計画だ。

OpenAIのロゴ
提供:Future Publishing/Contributor/Getty Images

 同社によると、人類にとって安全で有益な汎用人工知能(AGI)を実現するには、AIモデルがあらゆるテーマ、業界、文化、言語について、理解を深める必要があり、可能な限り広範なデータセットが必要だという。

 そのため、AIモデルがさまざまな領域に対する理解を深められるように、各国と業界にコンテンツの提供を呼びかけている。同社は既に、「GPT-4」のアイスランド語能力を強化するためにアイスランドの政府や企業と提携したり、非営利組織の協力を得て、膨大な法律文書をAIトレーニングに組み込んだりしているという。

 OpenAIは、「人間社会を反映する大規模なデータセット」で、現在オンラインで容易にアクセスできないものを求めている。テキスト、画像、音声、動画などの形態を問わず、長い会話や文章などのデータを求めている。

 同社は独自の次世代AI技術によって、データのデジタル化と構造化を支援できるという。これには光学式文字認識(OCR)技術や、自動音声認識(ASR)などが含まれる。機密情報や個人情報、サードパーティーに属する情報を含むデータセットは求めていないが、これらの情報を取り除くことには協力できるという。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]