編集部からのお知らせ
新型コロナ禍が組み替えるシステム
テレワーク関連記事一覧はこちら

マイクロソフト、音声認識の単語誤り率で新記録--Microsoft Research報告

Liam Tung (Special to ZDNet.com) 翻訳校正: 編集部

2016-09-15 12:43

 人間のように音声を理解する音声認識製品の開発でAmazon、Apple、Google、IBMなどと競合するMicrosoftが、音声認識の誤り率の低さで世界記録を達成したと発表した。

 Microsoftによると、Microsoft Researchの音声科学者は業界標準の評価の下で、単語誤り率(WER)6.3%を記録したという。利用したのは、将来的に「Cortana」を強化する音声認識技術だ。

 これまで記録を保持していたのはIBMの「Watson」チームで、WERは6.9%だった。IBMは2015年に達成した8%という記録を更新したばかりだった。

 MicrosoftとIBMは、米国時間9月12日までサンフランシスコで開催されたカンファレンス「Interspeech 2016」で、自社の音声認識に関する取り組みの詳細を記した論文を公表している。Googleの音声研究者も同カンファレンスで論文を発表した。

 Microsoftが記しているように、20年前までWERは43%だった。これはIBMが1995年に出した記録だ。IBMは記録を更新し、2004年には15.2%となっていた。

 だが、このところディープニューラルネットワークの研究への投資は増加しており、ハイテク大手らはWERを1桁台に下げている。それでもまだ、IBMが約4%と想定する、人間ほどの正確さを超えるレベルには達していない。

 Googleの最高経営責任者(CEO)Sundar Pichai氏は2015年、ディープニューラルネットワーク分野の強化により、音声認識システムのWERが8%になったと述べた。Googleの音声認識技術は、検索やAndroidで利用されている。

 最近では、元Microsoft Researchのメンバーで、現在AppleのSiri担当シニアディレクターを務めるAlex Acero氏が、音声認識の誤り率は「すべての言語で2分の1」に下がっており、多くの場合それ以上の改善が見られると述べていた。ディープラーニングに依るところが大きいとしている。

 Microsoftの音声認識システムの評価は、米国立標準技術研究所(NIST)が電話の会話音声認識をテストする目的で2000年に開始した評価となるNIST 2000 Switchboardを利用した。


提供:Microsoft

この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. ビジネスアプリケーション

    テレワークで起こりがちなトラブルの原因「資料が自宅から閲覧できない」にどう対処する?

  2. 経営

    CIOが成功するための最大の条件は「CEOとの連携」にあり?!516名のCIO調査を紐解く

  3. 経営

    【働き方改革事例】PCの調達・管理に関する不安を解決するサブスクリプションサービス

  4. クラウドコンピューティング

    【DX解説書】もっともDXに不向きな〇〇業界が取り組むべき改革とは?

  5. クラウドコンピューティング

    今すぐ「働き方改革」に着手するべき、2つの理由と改革への第一歩

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]