グーグル、画像生成AI「Imagen 3」の性能評価結果を公開

Sabrina Ortiz (ZDNET.com) 翻訳校正: 竹内杭 吉武稔夫 (ガリレオ)

2024-08-19 09:24

 市場には多数のAIチャットボットが存在し、最良のものを選ぶのは困難になりがちだ。Google DeepMindはこうした議論に決着をつけるべく主だったチャットボットを互いに競わせ、ユーザーが最も感銘を受けた画像生成AIは「Imagen 3」だったと発表した。

 Google DeepMindが米国時間8月14日に公開したレポートでは、Imagen 3の性能を前世代モデルの「Imagen 2」のほか、主要な他社モデル「DALL-E 3」「Midjourney v6」「Stable Diffusion 3 Large」「Stable Diffusion XL 1.0」に対し、人間による評価と自動評価の両面でどのように比べたかを詳述している。

 人間による評価では、テキストから画像を生成するモデルの5つの品質側面(満足度、プロンプトと画像の一致度、視覚的な魅力、詳細なプロンプトの反映度、数値的推論)についてテストした。

 全体的な満足度のカテゴリーは、入力したプロンプトによって得た画像について、ユーザーがどの程度満足できたかを測定したもので、次の画像で示すようにImagen 3が競合を大きく引き離して勝利する結果となった。

提供:Google Deepmind
提供:Google Deepmind

 Imagen 3は人間による別の評価カテゴリーに加え、自動評価項目すなわちプロンプトと画像の一致度(こちらでも)や画像品質においても競争力のある性能を発揮した。

 Imagen 3は「Google Labs」のツール「ImageFX」を通じて利用できる。Google Labsはアイデアや製品をテストするためのGoogleのプラットフォームだ。ほかのGoogle Labsツールと同様に、ImageFXも簡単に無料で利用できる。

 必要なのは、Google LabsにアクセスしてImageFXを選択するか、ImageFXのページに直接アクセスするだけだ。その後、自分のGoogleアカウントにサインインすれば、同ツールを操作することが可能になる。ほかの画像生成ツールと同じく、描いてほしい内容を会話形式で入力する。

 ImageFXのプロンプト入力インターフェースには、「表現チップ」という面白い機能がある。プロンプトを入力すると一部の単語について選択肢が表示されるのだが、これはプロンプトの内容を微調整する新しくて楽しい方法だ。Googleによれば「自分の創作物やアイデアに隣接する次元」を試せるという。

プロンプト:砂のあるきれいで青い浅瀬の海 提供:Sabrina Ortiz/ZDNET via ImageFX
プロンプト:砂のあるきれいで青い浅瀬の海
提供:Sabrina Ortiz/ZDNET via ImageFX

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]