Googleは米国時間3月29日、同25日に発表した「最もインテリジェント」なAIモデル「Gemini 2.5 Pro(experimental)」を全ユーザー向けに公開したことを明らかにした。
Gemini 2.5は、応答する前に思考を通して推論できる思考モデルであり、12月に登場した「Gemini 2.0 Flash Thinking」モデルに続くものである。
Gemini 2.5 Pro(experimental)は、「Humanity's Last Exam」(HLE)で、OpenAIの「OpenAI o3-mini」やAnthropicの「Claude 3.7 Sonnet」を上回っている。HLEは、急速に進化するモデルにとって業界テストの問題が簡単になりすぎている「ベンチマークの飽和」に対処するために最近策定されたベンチマークテストだ。そのため、優れた成績を収めるのが比較的難しいテストだが、Gemini 2.5のスコアは18.8%と、o3-miniの14%(評価対象はテキストのみで画像は含まず)やClaude 3.7 Sonnetの8.9%を上回っていた。

提供:Google
Gemini 2.5は、「Chatbot Arena」のリーダーボードで既に首位を獲得しており、科学、数学、コーディングの一般的なベンチマークでも競合モデルを上回っている。もっとも、その差は概して小さいが、新しいモデルの進化のスピードを考えれば、予想の範囲内と言えるだろう。Googleの報告によれば、Gemini 2.5 Pro(experimental)は、「1行のプロンプト」しかない場合でも、推論機能、マルチモーダル機能、エージェント機能に改善が見られるという。
Googleは「X」への投稿で、「Gemini 2.5 Pro(experimental)」を全てのユーザーに「レート制限付き」で展開すると述べた。まもなくモバイルにも対応するとしている。なお、「Gemini Advanced」ユーザーは、より大きなコンテキストウィンドウと拡張アクセスが提供されるとのことだ。

提供:Elyse Betters Picaro / ZDNET
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。