Meta、「このズボンに合う服は?」に答えられるAIを目指すプロジェクトを発表

Queenie Wong (CNET News) 翻訳校正: 緒方亮 長谷睦 佐藤卓 (ガリレオ)

2022-02-24 13:08

 人工知能(AI)のアシスタントと話していると、会話が自然に流れなかったり、アシスタントがこちらの指示を理解してくれなかったりして、もどかしくなることがある。

FacebookとMetaのロゴ
提供:Getty Images

 ソーシャルメディア大手のMeta(旧Facebook)はこの問題の解決に向けて取り組んできた。そして米国時間2月23日、AIアシスタントを改善するための新プロジェクト「Project CAIRaoke」を発表した。このプロジェクトは、拡張現実(AR)グラスや仮想現実(VR)ヘッドセット向けにMetaが開発するアシスタントの性能向上にも役立つはずだ。

 Metaは仕事、交流、買い物などができる仮想空間であるメタバースに注力するという、大きな賭けに出ている。メタバースは大部分がまだ仮説の域を出ないとはいえ、Metaの今後のビジョンにおいてARとVRは欠かせない部分を占めている。一方で、Metaが没入的なオンライン空間への参加を人々に推進するのは今回が初めてではなく、メタバースをめぐるこの狂騒が今後尻すぼみに終わるのかは、今のところはっきりしない。また、メタバースの構築には、ブライバシーやハラスメントなど、Metaがソーシャルメディアで対応に苦戦しているのと同じ問題がついて回る。

 Metaの共同創業者で最高経営責任者(CEO)のMark Zuckerberg氏は、メタバースをモバイルインターネットの次に来るものだとみている。人は今後、画面を凝視するよりも、仮想空間に別の人と一緒にいる感覚を味わいたくなるというのが、同氏の読みだ。

 Metaが23日に開催したオンラインのイベントで同氏は、「それには、ハードウェアデバイスからソフトウェア、仮想世界の構築や探究に至るまで、あらゆる分野で進歩が必要になる。そうした進歩を解き放つためのカギがAIだ」と述べた。

Mark Zuckerberg氏
Project CAIRaokeを発表するMark Zuckerberg氏
提供:Screenshot by Queenie Wong/CNET

 同氏はこのイベントで、「Builder Bot」というAIコンセプトのデモを通じて、仮想世界でのアシスタントの活用法を紹介した。

 このデモで、Zuckerberg氏のアバターは当初、公園の風景を描き出すようBuilder Botに頼むが、その後考えを変えて仮想のビーチに連れて行ってほしいと頼んだ。その後、同氏は雲や島、さらにはハイドロフォイルボード(水中翼をつけたサーフボード)を仮想世界に加えていった。同氏は以前、リアル世界でこのタイプのボードに乗っているところを写真に撮られたことがある。

 「このテクノロジーをさらに進化させれば、ユーザーの声による指示だけで、微妙なニュアンスが表現された世界を構築し、他の人々と体験を共有できるようになる」と、同氏は語った。

AIアシスタントを改善する

 Metaによれば、将来はProject CAIRaokeで作り出したモデルによって、人間が過去の会話を引き合いに出したり、話題を変えたり、あるいはジェスチャーを使ったりしても、AIアシスタントを混乱させることがなくなるという。ゆくゆくは、ARグラスをかけた人が「このパンツに合う服は何かな?」と尋ねると、アシスタントは「あなたが好きな色の赤のシャツがここにあります」などと答えられるようにするということだ。

 「(AIは)人が見ているものを一人称視点で見たり、人が聞いていることを聞いたりできるようになる。そして最も重要なことに、人がいる状況の文脈を理解できるようになる」と、Facebook AIでシニアリサーチマネージャーを務めるAlborz Geramifard氏は語った。

 MetaはProject CAIRaokeを解説する動画の中で、これを現時点のアシスタントで一般的に使用されている4つのモデル(自然言語理解、対話状態追跡、対話ポリシー管理、自然言語生成)を組み合わせたエンドツーエンドのAIモデルだと説明している。アシスタントによっては、特定の単語や語句を探すようにプログラミングされているものもあるが、CAIRaokeでは、文脈をより正確に理解し、同じ意味で使われている複数の異なる語句を認識することを目指すという。

ユニバーサルな音声言語翻訳

 Metaが取り組んでいるプロジェクトは、AIアシスタントの機能改善にとどまらない。Metaはさらに、ユーザーがオンラインコンテンツを自身の母語で利用する後押しとなるプロジェクトを2つ発表した。1つはあらゆる言語を学習できる翻訳システムの構築、もう1つはあらゆる言語を瞬時に音声翻訳するユニバーサルな音声言語翻訳プロジェクトだ。

 Metaによると、メタバースでは、話す言葉や住んでいる国が異なる人々と交流することになるため、メタバースの構築には翻訳精度の向上が欠かせないのだという。

 Facebook AI Research Parisの研究者であるAngela Fan氏は、「メタバースの創造や構築を多くの人が関わる共同作業として捉えた時、新しいテクノロジーに誰もがアクセスできるようにする取り組みを優先事項とする必要がある。それには、世界中の数十億人に向けて翻訳を用意しなければならない」と語った。Fan氏によると、Metaは英語がシステム内で使われるデフォルト言語ではなくなる状況に至るまで、翻訳を向上させることを目指している。

 Metaの推定によると、世界のおよそ25%にあたる約20億人が、利用できる翻訳システムがいまだにない言語を話しているという。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]