11月12日に「Windows 10」に初めての機能更新プログラムが提供された(関連記事)。今回のアップデートで追加された日本市場向けの機能の1つに、音声認識アシスタント「Cortana」日本語版がある。
Cortanaは、iPhoneに搭載された音声アシスタント機能「Siri」や、Googleの音声検索機能「Google Now」と同様に、音声認識と自然言語処理を用いて、会話型で検索や操作をアシストするものだ。
Azure Machine Learning(ML)の機械学習エンジンを使う学習機能を備える。ユーザーがCortanaに音声入力した内容を興味、場所、設定、音楽検索などのカテゴリごとに分類して「ノートブック」と呼ばれる場所に蓄積し、検索や回答の精度を高めていく。さらに、ユーザーごとの学習だけでなく、日本語音声で入力されたデータ全体をAzure MLで学習し、自然言語処理の性能を向上させている。
Microsoftのアジア地域の研究開発拠点であり、音声認識、自然言語処理、機械学習を含む人工知能(AI)分野の研究を行っているMicrosoft Research Asia所長の洪小文氏に、Cortanaの特徴や、同社のAI研究の目指すところについて話を聞いた。
Microsoft バイスプレジデント アジア太平洋地域 研究開発グループ チェアマン 兼 Microsoft Research Asia 所長 洪小文氏
Cortana、Siri、Google Nowは3つともテクノロジの大部分は同じものです。音声認識技術、自然言語処理を行い、ナレッジベースでユーザーの要求を理解します。ナレッジとしてインターネット検索を使うことも共通です。CortanaとSiriはバックエンドの検索エンジンとしてBingを使っています(Google NowはGoogle検索エンジン)。
3つのシステムの差別化ポイントはフロントエンドとバックエンドをどううまくつなげるか、ここが各社の腕の見せどころ。Cortanaの差別化ポイントは、iOSでしか動作しないSiriと異なり、Windows、iOS、Androidでも使えるクロスプラットフォーム仕様である点です。ユーザーがWindowsパソコンに音声認識させた情報もiPhoneへ音声認識させた情報も等しく学習し、どのプラットフォームに対しても同一のパーソナライズされたユーザーエクスペリエンスを提供します。
--音声認識や自然言語処理、AIをベースとしたMicrosoftのサービスには、Cortanaのほか、女子高生AI「りんな」や、会話をリアルタイムに翻訳する「Skype Translator」がありますが、それぞれ同じテクノロジを使っているのでしょうか。音声認識技術、自然言語処理、Azure MLを使った機械学習など要素技術は共通です。例えば、Skype Translatorでは、認識した音声をテキストデータ化し、文章の不要な部分を校正する処理を経て翻訳エンジンにデータを渡しています。そして、翻訳したテキストデータを再び音声化して、音声会話として返します。
Cortanaの音声認識の内部構造もSkype Translatorと同様で、認識した音声をテキストデータ化し、文章に校正処理をしてからAzure MLにデータを渡して、自然言語処理による文脈の理解をした上で、蓄積されたデータやインターネット上のナレッジをもとに適切な回答や操作を推論しています。
また、女子高生AI「りんな」はLINE上でテキストによる会話をするチャットボットですが、Cortanaと同様に、蓄積されたチャットのデータ、インターネット上のナレッジをもとに適切な回答を推論しています。
Cortanaとりんなは、AIの仕組みは同じですが、インプットするテキスト情報は別々のデータベースに蓄積し、別々に学習します。Cortanaはタスク処理のためのAIであり、生産性の向上を目指すもの、りんなは人をコンピュータの感情的なつながりを目的とするものであり、用途が異なるためです。
AI(またはコグニティブコンピューティング)といえばIBM Watsonがありますが、IBMはWatsonを「人の思考を代替するものではなく、人が正確な情報に基づいて判断ができるように支援するもの」と位置付けています(関連記事)。MicrosoftのAIが目指すところはWatsonと違いがありますか?“人の思考を代替するものではない”という点で、Microsoftが考えるAIはWatsonと同じです。コンピュータはルーチンワークを置き換えるものであり、新しいアルゴリズムを考えるのはあくまで人間。AIが超人的な存在になることはなく、AIと人間がつながることで超人になることが、Microsoftが目指す未来像です。
Watsonと異なる点は、MicrosoftのAIは自社のプロダクトを補完していくものとして開発しているところです。Cortanaは、Windows、Office 365、Dynamics CRMの機能をより高めるものであり、CortanaをフロントエンドとしてAzure MLや「Power BI」「Azure Event Hubs」「Azure HDInsight」などのクラウドアナリティクスサービスを使うことができる「Cortana Analytics Suite」も発表しています。