2022年の「ChatGPT」公開からブームが続く生成AIは、2024年に概念実証(PoC)から実用へと進めるかがポイントになりそうだ。「日本は大規模言語モデル(LLM)に注目が集まり過ぎた。生成AIアプリケーションという視点が重要ではないか」と話すのは、グーグル・クラウド・ジャパン代表の平手智行氏だ。
Google Cloudは、生成AIアプリを「エージェント(Agent)」とし、エージェントを構築する「Vertex AI Agent Builder」を年次イベント「Google Cloud Next」で発表した。同イベントで平手氏と上級執行役員 カスタマー エンジニアリング担当の小池裕幸氏に、Google Cloudの方向性や日本市場における生成AIの現状について話を聞いた。
グーグル・クラウド・ジャパン代表の平手智行氏(左)と上級執行役員 カスタマー エンジニアリング担当の小池裕幸氏
2024年のGoogle Cloud Next開催地となった米国ラスベガスの会場には、世界から3万人が集まった。そのうち約850人が日本の顧客やパートナーといい、関心の高さがうかがえる。イベントで同社は、チップレベルから開発まで各レイヤーで新機能を披露し、平手氏は、Google Cloudと競合との差別化のポイントとして「選択肢」を強調する。AIのインフラでは、初のArmベースのCPUとなる「Axion」や、第5世代の「Intel Xeon」プロセッサーのクラウドインスタンス、Nvidiaの次世代プラットフォーム「Blackwell」への対応などを発表している。
AI言語モデルは、同社のAI開発プラットフォーム「Vertex AI」で「Gemini 1.5 Pro」「Imagen 2」が利用できるようになるほか、米Anthropicの「Claude 3.0」のサポートなどが加わった。さらには、オープンソースでも同社の「CodeGemma」などが新たにサポートされた。平手氏は、「エンタープライズのお客さまに選択肢があるという部分は、今回さらに進化された」と述べる。
顧客に選択肢があることで、用途に応じたAIのモデルやインフラを選び、コストを最優先にした選択などができるという。それを支えるためにGoogle Cloudは、“サイドバイサイド”で適切なモデルを比較するなどの機能も提供する。小池氏は、「生成AIの知見が進んでいくと、それぞれの業務に合わせてLLMを使い分けるといったことをしたいというニーズが出てくる。Vertex AIはそれに答えられる」と話す。
エージェントでは、Vertex AIに加わった「Agent Builder」により、「Production readyのAIベースのソフトウェアを簡単に開発できる」と平手氏。さらには、Google検索がグラウンディング(AIの出力結果における検証可能なソース)になったことで、よりできることが広がるとする。
「生成AIに、『京都へ出張に行き、3時間空き時間ができた。3時間のトラベルガイドを作って』とお願いする場合、これまで推奨の寺院やルートを示すことはできても、寺院の参拝券やタクシーの手配は自分でする必要があった。これからは、検索がつながり、予約までしてくれる」(平手氏)
「Gemini Ride」として、日本のベンチャー企業のFaBoがミニカーを提供したデモ。目的地を入力する際に、単に「A企業のオフィス」などとするのではなく、「AIシステムを作ってくれる人を探している」とすると、そのためのプロンプトと画像を組み合わせて作成する。それを使ってGeminiに問い合わせると、「地図を見ると、AIに特化した企業であるGoogleがある。そこにいけばAIシステムを作ってくれる」などの回答が表示される。「そこにいく(Go)」ボタンを押すと、自動車にコマンドが発行されて走り出す。自動車は1周目で場所を見つけ、2周目でその場所の前で停車する
このように生成AIの活用が実行動にまでつながることから、平手氏は「LLMからLAM(Large Action Model)へとトレンドが移りつつある」と指摘する。このような「生成AIアプリ=エージェント」は、米国では“生成AIの次にくる波”という認識が広がりつつあるのだという。