Googleは先ごろ、「Gemini Live」のアップデートを実施した。これにより、言葉の理解精度が向上した。複数の言語、方言、アクセントへの対応が強化され、スムーズな会話、正確なリアルタイム翻訳、全体的な音声操作の改善が期待できる。
同社はメールでこれらの変更を発表し、今回のアップデートによりGemini Liveが「よりダイナミックで魅力的」になったと説明した。新しいモデルの名称については詳しく説明していないが、同社は1月に「Gemini 2.0 Flash」を導入した。会話機能であるGemini Liveには、別のモデルが使用されている。
今回のアップデートで最も大きな改善点は、言語認識機能だろう。Gemini Liveは1回の会話で複数の言語を理解できるようになった。例えば、英語とスペイン語を自由に切り替える会話でも、以前よりスムーズに対応できるはずだ。Googleのサポートページによると、Gemini Liveは45言語に対応している。
これに加え、Googleは会話中のさまざまな方言やアクセントをより正確に理解できるようになったと述べている。Geminiは多様な話し方を認識する能力が大幅に向上し、リアルタイムの多言語コミュニケーションに最適なツールとなっていることを実感できるだろう。

提供:Reddit user evelyn_teller/ ZDNET
また、Googleは数カ月以内にGemini Liveに画面共有機能とライブビデオストリーミング機能が追加されることを明らかにした。
あらためて説明すると、Geminiは「Android」スマートフォンに搭載されているGoogleの音声アシスタントの名称で、「iOS」用のアプリとしても利用できる。Gemini Liveは、AIと会話しながらタスクのサポートを受けたり、アイデアを練ったり、ただ会話を楽しんだりできる機能だ。
現時点では、写真をアップロードしてGeminiに質問できるが、近いうちにユーザーの画面に表示されているものをリアルタイムに確認できるようになる。これにより、「YouTube」動画、画像、文書を手動でアップロードすることなく、Geminiに支援を求めることができるようになるかもしれない。
これは、音声でのやりとりだけでなく、Geminiをよりインタラクティブで便利にするための大きな進歩だ。
これらの新機能に加えて、「Gemini Apps Activity」のデータ処理方法も更新されている。Gemini Apps Activityが有効になっている場合、Geminiは音声、動画、スクリーンショットをアクティビティーログに保存する。このデータの保存期間は3カ月、18カ月、36カ月のいずれかを選択でき、いつでも手動で削除可能だ。
その詳細については、「Google Apps Privacy Hub」に記載されている。
これらのアップデートは段階的に展開されているため、全ユーザーが同時に利用可能になるわけではない。アップデートが利用可能かどうかを確認したい場合は、Geminiに「最後にアップデートしたのはいつですか?」と尋ねれば確認できる。
これらの改善は、GoogleがGemini Liveを「エージェント時代」に近づけていることを示している。AIは質問に答えるだけでなく、リアルタイムのタスク、マルチタスク、デジタルコンテンツとの直接的なやりとりを支援するものとなるだろう。

提供:Sabrina Ortiz/ZDNET
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。