異種深層学習モデルと言語モデルを組みあわせる(出典:PFU)
文字認識ではGPUを活用した深層学習(ディープラーニング)で学習させることを狙ったものもあるが、今回のオプションでは学習モデルを最適化することでGPUレスでもGPU搭載と同等の処理速度で高速認識を実現できたと主張している。
インターネットに接続できない、つまりクラウドサービスを利用できない環境でも利用することを想定。機微情報を取り扱う金融機関や自治体の業務でも外部にデータを出すことなく利用できる。
PFUは現在、紙の文書からデータ抽出を自動化するクラウドサービス「PFU Smart Capture Service」を提供している。同サービスでもフリーピッチの日本語手書きに対応しているが、Cogent Labsが開発するAI OCRサービス「Tegaki」をベースにしており、Tegakiはディープラーニングで読取精度を継続的に向上させられる。
機微情報を扱う金融機関や自治体の場合、クラウドサービスを利用できない業務もあるために、PSCSも利用できない。そのため、スタンドアロン環境での読取精度の向上は半年ごとのソフトウェアのバージョンアップで対応する方針だ。
最小構成は実行するPC1台とスキャナー1台、DynaEye 10 帳票OCR Entry、AI日本語手書きという組み合わせで提供。この構成の参考価格が100万円から。
DynaEye 10 帳票 OCRは業務アプリケーションに組み込むこともできる。開発環境のSDKと実行環境用のランタイムをライセンスで購入できる。DynaEye 10 帳票OCR Entryも含めた、それぞれのライセンスは買い取りとサブスクリプションの2種類がある。買い取りの場合、別途保守が必要になる。サブスクリプションは、年額の使用料と保守料が金額に含まれる。
今回のソフトウェアはクライアント対応版だが、PFUは今後サーバー対応版の提供を予定している。