ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現 ~話し言葉の翻訳精度向上~

国立研究開発法人情報通信研究機構 広報部

From: 共同通信PRワイヤー

2017-06-28 15:00

2017年6月28日

国立研究開発法人情報通信研究機構(NICT) (リンク »)

ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現
~話し言葉の翻訳精度が大幅アップ・洗練された表現~

【ポイント】
■ 日・英、双方向の話し言葉の翻訳を対象として、ニューラル機械翻訳を開発
■ 従来技術 (統計翻訳)に比べ大幅に高い9割前後の翻訳精度を達成
■ 多言語音声翻訳アプリVoiceTraにニューラル機械翻訳技術を組み込んで公開

 国立研究開発法人情報通信研究機構(NICT、理事長: 徳田 英幸)の先進的音声翻訳研究開発推進センターは、ニューラルネットワーク(深層学習)を用いた機械翻訳の実用技術を開発しました。
 ニューラル機械翻訳(NMT)技術を用いることにより、従来の統計翻訳(SMT)技術に比べ、精度が大幅に向上しました。本日から、NICTが開発し、公開している音声翻訳アプリVoiceTra(ボイストラ) (リンク ») に同技術が組み込まれており、精度改善を直接ご体験いただけます。

*本件には、総務省の情報通信技術の研究開発 「グローバルコミュニケーション計画の推進-多言語音声翻訳技術の研究開発及び社会実証-Ⅰ.多言語音声翻訳技術の研究開発」における社会実証用コーパスの構築の成果を用いています。

【背景】
 訪日観光客数は2016年に2400万人を超え、2020年には4000万人に達する勢いになり、多言語音声翻訳へのニーズは日本各地で高まっています。これに応えるために、NICTで開発したVoiceTraの音声翻訳技術の製品化が、既に始まっています。
 一方で、近年の人工知能(AI)の進展は目覚ましく、ニューラルネットワーク(深層学習)に基づく実用化事例も増え、機械翻訳への適用も活発化し始めました。2013年から、ニューラル機械翻訳(NMT)の基礎研究を推進してきたNICTも、2016年12月にその実用化に着手しました。

【今回の成果】
・NICTは、対訳コーパスから自動翻訳の構築にニューラルネットワークを利用した機械翻訳を2013年から研究を開始し、2016年12月から実用化を加速しました。
・実用化には、様々な分野において話し言葉の対話で使われる固有名詞や専門用語辞書の追加が不可欠であり、この手段として「単語とその訳語及びそのクラス(意味分類)」を利用する手法を実装しました。
・翻訳精度(意味が通じる率を翻訳者が評価)を大幅に改善し、多分野(防災、買物、タクシー等)で9割前後の高精度を達成しました。
・既にニューラルネットワーク化されている音声認識部分に加えて、今回、翻訳のニューラルネットワーク化を実現し、一般公開されている多言語音声翻訳アプリVoiceTraのニューラルネットワーク化を前進させました。

【今後の展望】
 今回は、日英翻訳の双方向のみですが、グローバルコミュニケーション計画 (リンク ») の目標とされる全10言語(日本語、英語、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語)をカバーできるよう順次拡大を進めてまいります。
 さらに、積極的な技術移転により、民間での製品化を推進してまいります。
 また、現在、特許等の書き言葉のために翻訳エンジンのニューラルネットワーク化 (リンク ») も推進しています。



本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]