グーグルのブラウザー版AIエージェント「Project Mariner」とは

Sabrina Ortiz (ZDNET.com) 翻訳校正: 緒方亮 長谷睦 (ガリレオ)

2024-12-13 10:19

 ホリデーシーズンを前に、先行したOpenAIに続く形で、Googleが人工知能(AI)に関する一連の発表を行った。その中心にあるのがエージェントAIだ。この発表に含まれていた待望の生成AIの最新版「Gemini 2.0」は他の先進的なAI製品にも活用されるが、その1つが「Project Mariner」だ。

 Project Marinerは、Gemini 2.0に基づき構築された、人間とエージェントのインタラクションの可能性を探求する研究プロトタイプだ。これを用いると、使用中のブラウザーでのタスクの自動化が可能になる。AIエージェントのように、ウェブ上でタスクを任せると、ユーザーの代わりにやってくれる。そう聞くだけだと複雑に思えるかもしれないが、具体的な利用例を聞けば、これがどういう機能なのかよくわかるはずだ。

 では、これはどのような仕組みで機能しているのだろうか? Project Marinerは、試験運用版の「Chrome」拡張機能としてウェブブラウザーに常駐し、画像、コード、フォームなど、画面のコンテンツを理解することができる。右側のウィンドウにチャットボットがあり、ユーザーはそこにやってほしいタスクを何でも入力できる、という仕組みだ。

 Marinerは入力されたクエリーを理解すると、ユーザーに代わってリアルタイムでウェブサイトを見て回り、タスクの実行に必要なものについて推論を行い、実行の前にユーザーに計画を示す。Googleによると、Project Marinerをベンチマーク「WebVoyager」で評価したところ、単一エージェント設定で83.5%のスコアを達成したという。

 Googleのデモ動画では、ユーザーが企業4社の名前が並んだ「Googleスプレッドシート」を開いている。ここから各社の連絡先情報を探すのに、1つ1つ自分で調べるのではなく、拡張機能のMarinerに次のように頼む。「この企業リストを記憶して。次に、各社のウェブサイトを見つけ、私が連絡するのに使える、会社のメールアドレスを調べて。アドレスは私が後で使えるように覚えておいて」

 するとMarinerはウェブを見て回りながら、プロンプトにどのように取り組む計画なのかをステップごとに示してくれるので、ユーザーにもMarinerの推論のプロセスが見える。Marinerはバックグラウンドでは動かず、アクティブなタブでのみ機能する。さらにGoogleでは、常に人間の監督下に置くことを推奨している。

提供:Google
提供:Google

この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    Pマーク改訂で何が変わり、何をすればいいのか?まずは改訂の概要と企業に求められる対応を理解しよう

  2. セキュリティ

    従来型のセキュリティでは太刀打ちできない「生成AIによるサイバー攻撃」撃退法のススメ

  3. セキュリティ

    2025年はクラウドを標的にする攻撃が増加!?調査レポートに見る、今後警戒すべき攻撃トレンド

  4. セキュリティ

    生成AI活用の潜在的なセキュリティリスクに準備しておくべき「6つの戦略」とは?

  5. ビジネスアプリケーション

    業務マニュアル作成の課題を一気に解決へ─AIが実現する確認と修正だけで完了する新たなアプローチ

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]