筆者のお気に入りのブラウザー「Opera」に「Aria」というAI機能が搭載されてしばらく経つ。(調査や検索のため)まれにAIの力を借りる必要が生じると、いつもAriaに頼る。そのような目的には、OperaのAriaが素晴らしかった。
そこに先日、Operaの開発元であるOpera SoftwareがGoogleのAIモデル「Gemini」を追加してAriaを強化すると発表した。これはAriaが現在採用している大規模言語モデル(LLM)を置き換えようというものではない。実のところ、Ariaは複数のAIモデルを使ってクエリに対応する(与えられたクエリにいちばん適すると思われるモデルを選ぶ)。そのAriaが今回、「Gemini Nano」や「Gemini Ultra」など複数のモデルで構成されるGoogleのGeminiも利用できるようになったというわけだ。
Geminiの統合のポイントは、クエリへの回答がスピードアップして正確になることだけではない。読み上げなどの新機能がOperaのAIであるAriaに追加される。「Vertex AI」のモデル「Imagen 2」のおかげで、クエリに応えて画像を描くこともできるようになった。
また、Operaは「AI Feature Drops」というプログラムを発表した。Operaのエグゼクティブバイスプレジデントを務めるKrystian Kolondra氏は次のように述べている。「AIに関する動きは速く、われわれも速く動く。『Opera One』の正式版に採用されるものもそうでないものも含めて、AIに関するわれわれの最新の研究を試してもらえるAI Feature Dropsプログラムをスタートさせた。熱心なユーザーにテストしてもらい、フィードバックや提案を寄せてもらうことを楽しみにしている」
1つ注意しておかなければいけないのは、読み上げ機能も画像生成機能も、Operaの開発者向けのデスクトップ版では4月末から利用できるようになっている点だ。違いは、どちらの機能もGeminiの追加により信頼性が高まり大幅に高速化したところだ。加えて、GoogleのAIモデルを採用する前、Ariaのテキスト読み上げ機能は会話といえるほどのものではなかった。
テキスト読み上げ
筆者はまずテキスト読み上げ機能を試した。使うには、Ariaでクエリを実行する。回答が返ってきたら、回答の右上あたりにカーソルをあわせると、メニューが現れ、その中に小さいスピーカーのアイコンがある。そのアイコンをクリックすると、AI音声による回答の読み上げが始まる。驚いたことにかなり本物に近い声だった。あまり一般的ではない名前など、AIだと分かる部分も時折あったが、声のピッチ、響き、調子は自然だった(Googleのアシスタントの声よりもはるかによかった)。
Ariaに「Linux」の説明を頼んだ。
提供:Jack Wallen/ZDNET
画像生成
(Geminiを採用してから)Ariaの画像生成機能で変わった点はスピードと信頼性だけだ。Gemini以前に画像機能を試した時は、クエリに対応できずエラーを返してくることがあった。今同じことをやらせてみるとうまくいくかもしれない。Vertex AIのImagen 2のおかげで、画像生成は失敗しなくなっている。
「チェスをプレイするネコとネズミ」をAriaに描かせたもの。
提供:Jack Wallen/ZDNET
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。