人の“認知”を超えてきた―MS榊原CTOが深層学習フレームワークを説明 - (page 3)

羽野三千世 (編集部)

2016-11-29 07:00

音声認識の精度も人間に追いついてきた

 同社は11月24日に、音声翻訳サービス「Microsoft Translator」に、Microsoft Cognitive Toolkitのニューラルネットワークモデルを導入したことを発表した。現在、音声翻訳は9言語(アラビア語、北京語、英語、フランス語、ドイツ語、イタリア語、ブラジルポルトガル語、ロシア語、スペイン語)に対応、テキスト翻訳はこれら9言語に日本語を加えた10言語に対応している。

 テキスト翻訳と音声翻訳のフローについて、榊原氏は下図を用いて解説。テキスト翻訳は、「原文のテキスト→翻訳エンジン→翻訳したテキスト」のようにアウトプットされるが、音声翻訳では「音声をテキスト化(True Text)→テキストを修正(Corrected Text)→翻訳エンジン→翻訳したテキスト→音声変換」と処理される。


テキスト翻訳と音声翻訳の処理フロー

 画像認識と比較して、音声認識はまだ人間の認知能力を超えていないが、10月にMicrosoftの研究チームは、Microsoft Cognitive Toolkitを使った音声認識システムで、単語の誤認識率を5.9%まで改善したことを発表している。「人間の誤認識率は4%と言われており、音声認識の能力も人間に近づきつつある」(榊原氏)

深層学習でDynamics 365のCRM機能が向上する

 Microsoftは、ニューラルネットワークモデルで進化するAIの機能を、Office 365やDynamics 365にも導入している。例えば、Office 365内のコンテンツ、ユーザー間のやりとりなどを分析し、関係性・関連付けを保管するグラフデータベース「Office Graph」、およびOffice Graphのデータを活用するアプリケーション「Office Delve」には、深層学習のテクノロジが用いられている。榊原氏は、今後の展開として、Dynamics 365でOffice Graphを全面的に活用し、特にCRMのサービスの精度を高めていくと説明した。

 Microsoftは、Office Graphと、6月に買収したLinkedInの持つグラフデータベースを統合する計画を明らかにしている。「CRMは、見込み客や顧客の情報、取引情報をデータベースに蓄積してリレーションシップの拡充を図るもの。顧客のビジネスの内側(Office Graph)と、ビジネスの外側の関心(LinkedInなどのSNS)のデータを統合して分析することで、CRMの精度の向上が見込める」(榊原氏)


グラフデータベースの統合と深層学習でDynamics 365のCRM機能を向上

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]