NTT東、深層学習応用OCRサービス--手書き文字の認識率は96%、RPAも提供

阿久津良和

2019-01-24 06:45

 NTT東日本は1月23日、AI insideと業務提携して人工知能(AI)を活用した光学文字認識(OCR)である“AI OCR”サービス「AIよみと~る」の提供を開始した。手書き文字を含めた認識率は96%以上という。

 AI OCRとの組み合わせで業務を自動化できるロボティックプロセスオートメーション(RPA)サービスとしてNTTアドバンステクノロジの「WinActor」にサポートを付与した「おまかせRPA」も併せて提供する。

 今回のAI OCRの中核をなすのは、AI insideが独自開発したAI基盤「Neural X」にある。今回の業務提携についてNTT東日本 ビジネス開発本部 副本部長 石川達氏は「各業種に共通する課題が紙帳票の素材。デジタル化で生産性向上を目指すため、AI insideとの関係にたどり着いた」と説明する。

 AI inside 代表取締役社長で最高経営責任者(CEO)の渡久地択氏は「われわれはAIベンチャーとして画像認識技術に焦点を当ててきた。生産年齢人口の急減を迎えた日本は、出生率回避シナリオの是非に関係なくAIが必要だ。(2018年12月時点で300社以上が導入する)Neural X活用の場を広げるため、全国への販売網や手厚いサポートを持つNTT東日本と業務提携させていただいた」と両社が補完しあう関係で生まれたものと説明する。

NTT東日本 ビジネス開発本部 副本部長 石川達氏
NTT東日本 ビジネス開発本部 副本部長 石川達氏
AI inside 代表取締役社長CEO 渡久地択氏
AI inside 代表取締役社長CEO 渡久地択氏

 AIを活用したOCRソリューションは枚挙に暇がなく、一見すると「AIよみと~る」もさほど変わりないように思えるが、AI insideの渡久地氏は「学習と評価を半自動化した『学習アルゴリズム』、(一般物体認識や音声認識用アルゴリズムなど)他分野技術を応用した『推論アルゴリズム』、教師データをAIが生成する『生成アルゴリズム』を組み合わせた技術には自信がある」と語る。

 一般的なAI学習は教師データとなる画像ファイルと、正解ラベル(テキスト)を用意してAIモデルを作成するものの、この方法は画像データの収集や膨大な時間とコストが必要だ。AI insideでは、正解ラベルをもとにした教師データを作成するアルゴリズムを用いた。

 「これが(Neural Xにおける)初期のブレイクスルー。1億枚以上の画像生成も可能で、現在は文字認識精度は(利用者増も相まって)急カーブを描くように高まっている」(渡久地氏)

 その「AIよみと~る」は、Neural Xの学習アルゴリズムを使用した深層学習で、欄外にはみ出した数字を自動補完し、訂正箇所の読み飛ばしやスマートフォンなどで撮影した画像のゆがみや傾き、ファクスでノイズが発生した帳票も自動補正する機能を備える。

 「おまかせRPA」は導入実績約2500社を超えるWinActorに、エンジニアが導入顧客先を訪問して初期設定を行う有料サポートや、運用開始後のトラブルシューティングなどを電話や遠隔操作で行うサポートを組み合わせたものとなる。NTT東日本は2つのサービスについて、あくまでもIT専任担当者がいない中堅中小企業での利用を想定し、サポートを用意したと説明する。

 NTT東日本が2018年度第2四半期(7~9月)に実施した両ソリューションのトライアルは、実際に賃貸不動産業で契約申込書のデータ化、基幹システムへの自動登録を行ったところ、手書き文字は94.7%の認識率に達した。作業時間の短縮率は55%削減におよぶ。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

注目している大規模言語モデル(LLM)を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]