「Gemini Live」で複数の言語、方言、アクセントへの理解精度が向上

Artie Beaty Elyse Betters-Picaro (Special to ZDNET.com) 翻訳校正: 編集部

2025-02-14 07:41

 Googleは先ごろ、「Gemini Live」のアップデートを実施した。これにより、言葉の理解精度が向上した。複数の言語、方言、アクセントへの対応が強化され、スムーズな会話、正確なリアルタイム翻訳、全体的な音声操作の改善が期待できる。

 同社はメールでこれらの変更を発表し、今回のアップデートによりGemini Liveが「よりダイナミックで魅力的」になったと説明した。新しいモデルの名称については詳しく説明していないが、同社は1月に「Gemini 2.0 Flash」を導入した。会話機能であるGemini Liveには、別のモデルが使用されている。

 今回のアップデートで最も大きな改善点は、言語認識機能だろう。Gemini Liveは1回の会話で複数の言語を理解できるようになった。例えば、英語とスペイン語を自由に切り替える会話でも、以前よりスムーズに対応できるはずだ。Googleのサポートページによると、Gemini Liveは45言語に対応している。

 これに加え、Googleは会話中のさまざまな方言やアクセントをより正確に理解できるようになったと述べている。Geminiは多様な話し方を認識する能力が大幅に向上し、リアルタイムの多言語コミュニケーションに最適なツールとなっていることを実感できるだろう。

提供:Reddit user evelyn_teller/ ZDNET
提供:Reddit user evelyn_teller/ ZDNET

 また、Googleは数カ月以内にGemini Liveに画面共有機能とライブビデオストリーミング機能が追加されることを明らかにした。

 あらためて説明すると、Geminiは「Android」スマートフォンに搭載されているGoogleの音声アシスタントの名称で、「iOS」用のアプリとしても利用できる。Gemini Liveは、AIと会話しながらタスクのサポートを受けたり、アイデアを練ったり、ただ会話を楽しんだりできる機能だ。

 現時点では、写真をアップロードしてGeminiに質問できるが、近いうちにユーザーの画面に表示されているものをリアルタイムに確認できるようになる。これにより、「YouTube」動画、画像、文書を手動でアップロードすることなく、Geminiに支援を求めることができるようになるかもしれない。

 これは、音声でのやりとりだけでなく、Geminiをよりインタラクティブで便利にするための大きな進歩だ。

 これらの新機能に加えて、「Gemini Apps Activity」のデータ処理方法も更新されている。Gemini Apps Activityが有効になっている場合、Geminiは音声、動画、スクリーンショットをアクティビティーログに保存する。このデータの保存期間は3カ月、18カ月、36カ月のいずれかを選択でき、いつでも手動で削除可能だ。

 その詳細については、「Google Apps Privacy Hub」に記載されている。

 これらのアップデートは段階的に展開されているため、全ユーザーが同時に利用可能になるわけではない。アップデートが利用可能かどうかを確認したい場合は、Geminiに「最後にアップデートしたのはいつですか?」と尋ねれば確認できる。

 これらの改善は、GoogleがGemini Liveを「エージェント時代」に近づけていることを示している。AIは質問に答えるだけでなく、リアルタイムのタスク、マルチタスク、デジタルコンテンツとの直接的なやりとりを支援するものとなるだろう。

提供:Sabrina Ortiz/ZDNET
提供:Sabrina Ortiz/ZDNET

この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    「100人100通りの働き方」を目指すサイボウズが、従業員選択制のもとでMacを導入する真の価値

  2. セキュリティ

    「脱VPN」で実現するゼロトラストセキュリティ!VPNの課題を解消し、安全なリモートアクセスを確立

  3. セキュリティ

    最新調査が示すセキュリティ対策の「盲点」とは?|ゼロトラスト、生成AI、サプライチェーンリスクの実態

  4. セキュリティ

    警察把握分だけで年間4000件発生、IPA10大脅威の常連「標的型攻撃」を正しく知る用語集

  5. セキュリティ

    ソフトバンクロボティクスが、グローバル規模で安全かつ効率的にiPhoneのBYODを実現できた理由

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]