Googleの最先端の人工知能(AI)モデルファミリーである「Gemini 2.5」が、全面的にアップグレードされることになった。
Googleは米国時間5月20日、年次開発者会議「Google I/O 2025」で、「Gemini 2.5 Pro」向けの「強化」推論モード「Deep Think」を発表した。このモードは、複雑な数学やコーディングで「目覚ましい」能力を発揮するという。また、2.5 Proに加え、もう1つの「最も高性能」なモデル「Gemini 2.5 Flash」に対する改善点も発表した。具体的な新機能は以下の通りだ。
Gemini 2.5 Proのアップデート
最も注目すべき点は、Deep Thinkと呼ばれる新しい実験的な推論モードが2.5 Proに追加されたことだ。同社によれば、Deep Thinkは「モデルが応答前に複数の仮説を検討することを可能にする新しい研究技術」を用いているという。
ベンチマークを見ると、Deep Thinkはマルチモーダル推論テストの「MMMU」で84.0%のスコアを記録している。また、非常に難しい数学ベンチマークの「2025年米国数学オリンピック」(USAMO)でも「優れたスコア」を獲得したとされているが、Googleは具体的な数値を明らかにしていない。
なお、Googleは発表の中で、「最先端の安全性評価を実施し、安全専門家からさらなる意見を得るために、通常よりも時間を費やして」いると述べ、「その取り組みの一環として、広く一般に提供する前に、『Gemini API』を通じてテスターの方々に提供し、フィードバックをいただく予定」だと付け加えている。
Gemini 2.5 Flashのアップデート
Googleは低コストモデルの2.5 Flashで実施した改善点について詳しく説明していないが、推論、コード、マルチモーダル、長文コンテキストに関する能力が向上し、効率化も進んだという。このモデルではトークンの使用量が20〜30%削減された、と同社は評価している。
また、4月29日に公開された2.5 Flashのモデルカードには、同モデルが「Humanity's Last Exam」(HLE)で12.1%のスコアを獲得したと記されている。HLEは、各社のモデルが従来の業界標準ベンチマークを急速に上回り、極めて高いスコアを獲得するケースが多い現状への対応を目的とした比較的新しいベンチマークテストだ。今回の2.5 Flashのスコアは、OpenAIの「o4-mini」モデルが獲得した14.3%に次ぐものとなっている。
開発者は、「Google AI Studio」経由で新しい2.5 Flashのプレビュー版を利用できる。企業ユーザーを含む他のすべてのユーザーは、「Vertex AI」と「Gemini」アプリで試してみることが可能だ。本番環境向けの一般提供は6月上旬に予定されている。

提供:MirageC/Getty Images
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。