市場には多数のAIチャットボットが存在し、最良のものを選ぶのは困難になりがちだ。Google DeepMindはこうした議論に決着をつけるべく主だったチャットボットを互いに競わせ、ユーザーが最も感銘を受けた画像生成AIは「Imagen 3」だったと発表した。
Google DeepMindが米国時間8月14日に公開したレポートでは、Imagen 3の性能を前世代モデルの「Imagen 2」のほか、主要な他社モデル「DALL-E 3」「Midjourney v6」「Stable Diffusion 3 Large」「Stable Diffusion XL 1.0」に対し、人間による評価と自動評価の両面でどのように比べたかを詳述している。
人間による評価では、テキストから画像を生成するモデルの5つの品質側面(満足度、プロンプトと画像の一致度、視覚的な魅力、詳細なプロンプトの反映度、数値的推論)についてテストした。
全体的な満足度のカテゴリーは、入力したプロンプトによって得た画像について、ユーザーがどの程度満足できたかを測定したもので、次の画像で示すようにImagen 3が競合を大きく引き離して勝利する結果となった。

提供:Google Deepmind
Imagen 3は人間による別の評価カテゴリーに加え、自動評価項目すなわちプロンプトと画像の一致度(こちらでも)や画像品質においても競争力のある性能を発揮した。
Imagen 3は「Google Labs」のツール「ImageFX」を通じて利用できる。Google Labsはアイデアや製品をテストするためのGoogleのプラットフォームだ。ほかのGoogle Labsツールと同様に、ImageFXも簡単に無料で利用できる。
必要なのは、Google LabsにアクセスしてImageFXを選択するか、ImageFXのページに直接アクセスするだけだ。その後、自分のGoogleアカウントにサインインすれば、同ツールを操作することが可能になる。ほかの画像生成ツールと同じく、描いてほしい内容を会話形式で入力する。
ImageFXのプロンプト入力インターフェースには、「表現チップ」という面白い機能がある。プロンプトを入力すると一部の単語について選択肢が表示されるのだが、これはプロンプトの内容を微調整する新しくて楽しい方法だ。Googleによれば「自分の創作物やアイデアに隣接する次元」を試せるという。

プロンプト:砂のあるきれいで青い浅瀬の海
提供:Sabrina Ortiz/ZDNET via ImageFX
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。