OpenAI、テキストから動画を生成するAIモデル「Sora」を発表

ZDNET Japan Staff

2024-02-16 11:54

 OpenAIは米国時間2月15日、テキストから動画を生成できる人工知能(AI)モデル「Sora」を発表した。ユーザーのテキストプロンプトに基づき、現実的で想像力に富んだ最長1分間の動画を生成できるという。

OpenAIの動画からのスクリーンショット。ビル群の間を多数の魚が泳いでいる
提供:OpenAI/Screenshot by Lisa Lacy/CNET

 同社は、AIモデルが物理的な世界での動きを理解し、シミュレーションできるように訓練することで、現実世界のやり取りを必要とする問題解決に役立てたいと説明している。

 AIがもたらす害やリスクを評価するために編成された「レッドチーム」のメンバーや、ビジュアルアーティスト、デザイナー、映画制作者などに、同日よりSoraへのアクセスを提供し、今後の改善に向けてフィードバックを得る。

 Soraは複数のキャラクター、特定の種類のモーション、対象物や背景の詳細などを含む、複雑なシーンを生成できる。また、ユーザーのプロンプトを理解するだけでなく、それらのものが物理世界でどのように存在するかも理解できるという。

 一方、同社は現行のモデルに弱点があることも認めている。複雑なシーンの物理を正確にシミュレーションできなかったり、原因と結果を理解できないことがあるという。例えば、人がクッキーをかじった後、その跡がクッキーに反映されない場合などがある。

 ほかにも、左右を混同するなど、プロンプトの空間に関する説明や、カメラの動きをたどるといった経時的な出来事の説明を、誤って解釈することがあるという。

 同社は、誤解を招くコンテンツを特定できるように、Soraによって生成された動画を判別するためのツールも開発中だ。この生成モデルをOpenAI製品に導入する際は、動画の来歴情報が分かるC2PAメタデータを実装する計画だ。

 Soraが生成した多数の動画サンプルが、そのプロンプトとともに公開されている。ネオンの光がきらめく夜の東京を闊歩するスタイリッシュな女性や、雪原を歩んでくる巨大なマンモスの毛が風になびく様子などを見ることができる。

 1月にはGoogleが、テキストプロンプトや画像から非常にリアルな動画を生成するAIモデル「Lumiere」を発表していた。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. ビジネスアプリケーション

    生成 AI 「Gemini」活用メリット、職種別・役職別のプロンプトも一挙に紹介

  2. セキュリティ

    まずは“交渉術”を磨くこと!情報セキュリティ担当者の使命を果たすための必須事項とは

  3. セキュリティ

    迫るISMS新規格への移行期限--ISO/IEC27001改訂の意味と求められる対応策とは

  4. セキュリティ

    マンガで分かる「クラウド型WAF」の特徴と仕組み、有効活用するポイントも解説

  5. ビジネスアプリケーション

    急速に進むIT運用におけるAI・生成AIの活用--実態調査から見るユーザー企業の課題と将来展望

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]