PFUは9月26日、業務用の光学文字認識(OCR)ソフトウェア「DynaEye 10」シリーズのオプション「AI日本語手書きOCR」の販売を開始した。最小構成の参考価格は100万円から。
DynaEyeは1997年に販売開始。自治体での介護保険認定審査や官公庁での調査票、銀行の営業店、医療機関での問診票や検査所、生損保の契約書や申請書などで活用されている。
システムへの入力業務に活用されるクライアントPCにインストールできる「DynaEye 10 帳票OCR Entery」は“エントリーアプリケーション”と“標準アプリケーション”の2種類を搭載している。エントリーアプリケーションは取引先でレイアウトが異なる請求書や注文書、納品書などを手軽に読み取ることが目的。標準アプリケーションは、定型帳票の手書き文字や活字、バーコードなどを高精度に読み取るのが目的。
標準アプリケーションは、帳票のレイアウトごとに読み取る領域を定義することでOCRの精度を高めている。エントリーアプリケーションで定義するのは項目名と属性。読取位置は自動で学習する。
今回、オプションとして提供されるAI日本語手書きOCRは、住所や名前を書き込む欄で一文字ごとの区切りがない“フリーピッチ”での手書き文字のOCR処理の精度を高めようというものになる。エンジンにPFUの親会社である富士通の人工知能(AI)基盤「FUJITSU Human Centric AI Zinrai」を活用している。
Zinraiの“異種深層学習モデル”と“言語モデル”で認識精度の向上に成功したと説明。異種深層学習モデルで文字と一緒に、文字として存在しない偏(へん)と旁(つくり)が組み合ってしまった“非文字”も学習させることで手書き文字の区切りを判別させるようにしている。
フリーピッチの手書き文字では従来、認識の向上が見込めなかったが、Zinraiの活用で認識精度を高められるという(出典:PFU)
言語モデルでは、文字の種別ごとに活用できる複数の言語モデルで認識精度の向上を狙っている。認識候補が正しい文字列となるように解析して補正して出力している。PFUによれば、Zinraiを活用することでフリーピッチの手書き文字認識の精度は住所で95.5%、氏名で94.9%という。