Googleが、Google Neural Machine Translation(Googleニューラル機械翻訳:GNMT)システムを発表した。これによって「Google Translate」サービスによる翻訳の誤りが55~85%低減されるという。
Google翻訳の10周年に合わせて発表された同システムについて、Google Brain TeamのリサーチサイエンティストであるQuoc Le氏とMike Schuster氏は、同社は既に画像および音声認識システムの改良にマシンインテリジェンスを活用しているが、機械翻訳の改良はこれまで「困難」だったと述べた。
現在のGoogle翻訳で使用されているPhrase-Based Machine Translation(フレーズベースの機械翻訳:PBMT)システムでは、文章の中の単語やフレーズが個々に翻訳されるが、これとは異なり、ニューラル機械翻訳では、文全体を1つの翻訳単位として捉える。
論文「Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation」によると、同システムは、英語からフランス語、そして英語からドイツ語の翻訳において特に「最高水準」の能力を発揮し、誤りを平均で60%低減するという。
Googleのモデルは「8つのエンコーダと8つのデコーダの階層を持つディープLSTM(Long Short Term Memory)ネットワークで構成」されていると、論文には記されている。元の言語をベクトルのリストにエンコードし、デコーダが元の言語のベクトルとの関連性を考慮しながら他の言語に翻訳する様子をブログでも説明している。

また「最終的な翻訳速度を高めるために、推論時には低精度の算術演算を採用している。また、珍しい単語の処理を改良するために、入力と出力の両方で、限られた数の一般的なサブ単語単位(wordpiece)に単語を分割する。この方法によって、「文字」で区切られたモデルの柔軟性と「単語」で区切られたモデルの効率の間の適切なバランスがとられ、珍しい単語が自然な形で処理されて、最終的にはシステムの全体的な精度が高まる」ともいう。

中国語から英語へのPBMT、GNMT、人間による翻訳の例
提供:Google
Googleは、中国語から英語への翻訳を対象に、実稼働のGNMTをウェブ版とモバイル版のGoogle翻訳にリリース済みで、毎日約1800万件の翻訳に適用されている。今後数カ月の間に、GNMTの対象範囲が他の言語にも拡大される予定だ。

各言語の翻訳でPBMT、GNMT、人間による翻訳を比較
提供:Google
Googleは機械学習の「TensorFlow」および「Tensor Processing Unit(TPU)」でGNMTの実用化を実現した。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。