Amazonは米国時間6月5日、「Alexa Conversations」を発表した。これは、開発者が「Alexa」で自然な音声体験を作成するためのディープラーニングベースのアプローチだ。同社によると、このツールセットを使うことで、開発者はより少ないコードと訓練データで自然な対話を構築できるという。現在、米国でプレビュー段階にある。
Conversationsを使用するために、開発者は自分のスキルの機能へのAPIアクセス、Alexaが顧客に伝えるプロンプトを含む注釈付きの対話サンプル、顧客が実行しそうなアクションを提供する。Alexa ConversationsのAIは、その入力データを使用して、対話フローとバリエーションを生成する。
Alexa AI担当バイスプレジデントでヘッドサイエンティストのRohit Prasad氏は5日、ラスベガスで開催されているAmazonの「re:MARS」カンファレンスで、「Alexa Conversationsで複雑な音声体験の構築が大幅に簡単になるのは、ディープラーニングベースの対話モデリングが基礎にあるからだ」と述べた。
Prasad氏は、開発者が単一の会話で複数のタスクを完了するAlexaスキルを作成できるようにする新しいMLベースのコンセプトも発表した。現在、Alexaは1回限りの要求しか処理できないため、ユーザーは複雑な質問を1つずつ考える必要がある。このマルチスキル体験は、相互に連携するAIモジュール群を利用することにより、単一の会話で顧客のさまざまな質問や要求への応答を生成する。
Prasad氏によると、このアプローチは、システム全体をエンドツーエンドでモデル化するという点で、ほかの対話システムと異なるという。つまり、システムは音声テキストを入力として受け取り、アクションを出力として提供する。アクションの予測は、対話履歴全体を考慮に入れる機械学習型の会話モデルをベースとしている。
Prasad氏は、「この新しいアプローチによって、Alexaは会話の方向性から顧客の潜在的な目的を予測し、先を読んでトピックやスキルの会話フローを実現する」とし、「これは会話型AIの大きな進歩だ。われわれの目的は、コグニティブの負担を顧客からAlexaにシフトさせることだ」と述べた。
このマルチスキルシステムは数カ月以内にまず米国でリリースされる予定で、夕食と映画の予定を立てる機能が提供される。それでも、機械学習のさらなる進歩により、これまでにAlexaの精度が20%向上しているとPrasad氏は述べた。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。