編集部からのお知らせ
(記事集)ニューノーマルで伸びる業界
「ニューノーマルとIT」新着記事一覧

AI翻訳サービスにPDF翻訳機能が追加--OCR活用で画像中のテキストも

大場みのり (編集部)

2020-01-27 17:09

 法人向け翻訳サービスを提供する十印は1月27日、人工知能(AI)翻訳サービス「T-tact AN-ZIN」において、PDFファイルの翻訳機能を追加したと発表した。同社は、この機能を開発する総務省と情報通信研究機構(NICT)のプロジェクトに協力しており、その成果を商用化した。光学文字認識(OCR)機能も搭載しているため、テキストを抽出できないスキャンデータや画像中のテキストも翻訳できるという。同サービスの翻訳精度は原文の複雑さによるものの、TOEIC900点以上の人間が翻訳した場合と同等だとしている。

 AIを活用した翻訳システムでは従来、翻訳できるPDFファイルはテキストを抽出できるものに限られていた。さらに、PDFの行末には不要な改行が入るため、翻訳の精度が格段に落ちてしまっていたという。T-tact AN-ZINのPDF翻訳機能は、不要な改行を削除した形でWordファイルに変換し、その上で翻訳を行う。精度は、PDF以外のファイルと同じだとしている。

T-tact AN-ZINのPDF翻訳イメージ(出典:十印)
T-tact AN-ZINのPDF翻訳イメージ(出典:十印)

 使用方法に関しては、ユーザーが翻訳したいファイルを選択してOCR機能の使用の有無を設定。数十秒間で、Wordファイルに変換された翻訳済みのファイルをダウンロードすることができる。

PDF翻訳の使用画面(出典:十印)
PDF翻訳の使用画面(出典:十印)

 PDF翻訳機能が有効なのは、8MB以内のファイル、2000文まで。2000文を超える場合はWordへの変換のみが行われ、ユーザーはファイルを2000文以内に収まるよう分割し、再度翻訳にかけることが必要。OCR機能は、30ページまで有効だという。

ZDNet Japan 記事を毎朝メールでまとめ読み(登録無料)

特集

CIO

モバイル

セキュリティ

スペシャル

ホワイトペーパー

新着

ランキング

  1. 運用管理

    ファイルサーバ管理のコツはここにあり!「無法状態」から脱出するプロセスを徹底解説

  2. クラウドコンピューティング

    社員の生産性を約2倍まで向上、注目の企業事例から学ぶDX成功のポイント

  3. コミュニケーション

    真の顧客理解でCX向上を実現、いまさら聞けない「データドリブンマーケティング」入門

  4. ビジネスアプリケーション

    デメリットも把握しなければテレワークは失敗に?─LIXIL等に学ぶ導入ステップや運用のコツ

  5. 運用管理

    ニューノーマルな働き方を支えるセキュリティ-曖昧になる境界に変わらなくてはならないデータセンター運用

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNet Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]