CortanaとSiriはどう違う?:MSリサーチアジア所長の洪小文氏に訊く

羽野三千世 (編集部) 2015年11月18日 07時00分

  • このエントリーをはてなブックマークに追加

 11月12日に「Windows 10」に初めての機能更新プログラムが提供された(関連記事)。今回のアップデートで追加された日本市場向けの機能の1つに、音声認識アシスタント「Cortana」日本語版がある。

 Cortanaは、iPhoneに搭載された音声アシスタント機能「Siri」や、Googleの音声検索機能「Google Now」と同様に、音声認識と自然言語処理を用いて、会話型で検索や操作をアシストするものだ。

 Azure Machine Learning(ML)の機械学習エンジンを使う学習機能を備える。ユーザーがCortanaに音声入力した内容を興味、場所、設定、音楽検索などのカテゴリごとに分類して「ノートブック」と呼ばれる場所に蓄積し、検索や回答の精度を高めていく。さらに、ユーザーごとの学習だけでなく、日本語音声で入力されたデータ全体をAzure MLで学習し、自然言語処理の性能を向上させている。

 Microsoftのアジア地域の研究開発拠点であり、音声認識、自然言語処理、機械学習を含む人工知能(AI)分野の研究を行っているMicrosoft Research Asia所長の洪小文氏に、Cortanaの特徴や、同社のAI研究の目指すところについて話を聞いた。


Microsoft バイスプレジデント アジア太平洋地域 研究開発グループ チェアマン 兼 Microsoft Research Asia 所長 洪小文氏
--CortanaはSiri、Google Nowとどう違うのですか?

 Cortana、Siri、Google Nowは3つともテクノロジの大部分は同じものです。音声認識技術、自然言語処理を行い、ナレッジベースでユーザーの要求を理解します。ナレッジとしてインターネット検索を使うことも共通です。CortanaとSiriはバックエンドの検索エンジンとしてBingを使っています(Google NowはGoogle検索エンジン)。

 3つのシステムの差別化ポイントはフロントエンドとバックエンドをどううまくつなげるか、ここが各社の腕の見せどころ。Cortanaの差別化ポイントは、iOSでしか動作しないSiriと異なり、Windows、iOS、Androidでも使えるクロスプラットフォーム仕様である点です。ユーザーがWindowsパソコンに音声認識させた情報もiPhoneへ音声認識させた情報も等しく学習し、どのプラットフォームに対しても同一のパーソナライズされたユーザーエクスペリエンスを提供します。

--音声認識や自然言語処理、AIをベースとしたMicrosoftのサービスには、Cortanaのほか、女子高生AI「りんな」や、会話をリアルタイムに翻訳する「Skype Translator」がありますが、それぞれ同じテクノロジを使っているのでしょうか。

 音声認識技術、自然言語処理、Azure MLを使った機械学習など要素技術は共通です。例えば、Skype Translatorでは、認識した音声をテキストデータ化し、文章の不要な部分を校正する処理を経て翻訳エンジンにデータを渡しています。そして、翻訳したテキストデータを再び音声化して、音声会話として返します。

 Cortanaの音声認識の内部構造もSkype Translatorと同様で、認識した音声をテキストデータ化し、文章に校正処理をしてからAzure MLにデータを渡して、自然言語処理による文脈の理解をした上で、蓄積されたデータやインターネット上のナレッジをもとに適切な回答や操作を推論しています。

 また、女子高生AI「りんな」はLINE上でテキストによる会話をするチャットボットですが、Cortanaと同様に、蓄積されたチャットのデータ、インターネット上のナレッジをもとに適切な回答を推論しています。

 Cortanaとりんなは、AIの仕組みは同じですが、インプットするテキスト情報は別々のデータベースに蓄積し、別々に学習します。Cortanaはタスク処理のためのAIであり、生産性の向上を目指すもの、りんなは人をコンピュータの感情的なつながりを目的とするものであり、用途が異なるためです。

AI(またはコグニティブコンピューティング)といえばIBM Watsonがありますが、IBMはWatsonを「人の思考を代替するものではなく、人が正確な情報に基づいて判断ができるように支援するもの」と位置付けています(関連記事)。MicrosoftのAIが目指すところはWatsonと違いがありますか?

 “人の思考を代替するものではない”という点で、Microsoftが考えるAIはWatsonと同じです。コンピュータはルーチンワークを置き換えるものであり、新しいアルゴリズムを考えるのはあくまで人間。AIが超人的な存在になることはなく、AIと人間がつながることで超人になることが、Microsoftが目指す未来像です。

 Watsonと異なる点は、MicrosoftのAIは自社のプロダクトを補完していくものとして開発しているところです。Cortanaは、Windows、Office 365、Dynamics CRMの機能をより高めるものであり、CortanaをフロントエンドとしてAzure MLや「Power BI」「Azure Event Hubs」「Azure HDInsight」などのクラウドアナリティクスサービスを使うことができる「Cortana Analytics Suite」も発表しています。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

  • このエントリーをはてなブックマークに追加

この記事を読んだ方に

関連ホワイトペーパー

連載

CIO
シェアリングエコノミーの衝撃
デジタル“失敗学”
コンサルティング現場のカラクリ
Rethink Internet:インターネット再考
インシデントをもたらすヒューマンエラー
トランザクションの今昔物語
エリック松永のデジタルIQ道場
研究現場から見たAI
Fintechの正体
米ZDNet編集長Larryの独り言
大木豊成「仕事で使うアップルのトリセツ」
山本雅史「ハードから読み解くITトレンド放談」
田中克己「展望2020年のIT企業」
松岡功「一言もの申す」
松岡功「今週の明言」
内山悟志「IT部門はどこに向かうのか」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
大河原克行「エンプラ徒然」
内製化とユーザー体験の関係
「プロジェクトマネジメント」の解き方
ITは「ひみつ道具」の夢を見る
セキュリティ
エンドポイントセキュリティの4つの「基礎」
企業セキュリティの歩き方
サイバーセキュリティ未来考
ネットワークセキュリティの要諦
セキュリティの論点
スペシャル
エンタープライズAIの隆盛
インシュアテックで変わる保険業界
顧客は勝手に育たない--MAツール導入の心得
「ひとり情シス」の本当のところ
ざっくり解決!SNS担当者お悩み相談室
生産性向上に効くビジネスITツール最前線
ざっくりわかるSNSマーケティング入門
課題解決のためのUI/UX
誰もが開発者になる時代 ~業務システム開発の現場を行く~
「Windows 10」法人導入の手引き
ソフトウェア開発パラダイムの進化
エンタープライズトレンド
10の事情
座談会@ZDNet
Dr.津田のクラウドトップガン対談
Gartner Symposium
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
Microsoft Connect()
HPE Discover
Oracle OpenWorld
Dell Technologies World
AWS re:Invent
AWS Summit
PTC LiveWorx
吉田行男「より賢く活用するためのOSS最新動向」
古賀政純「Dockerがもたらすビジネス変革」
中国ビジネス四方山話
ベトナムでビジネス
日本株展望
企業決算
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]