TIS(新宿区)は3月22日、紙資料データ化サービス「Paper Searcher」を発表した。人工知能(AI)を活用して手書き文字を高精度でデータ化する光学文字認識(OCR)サービス「Tegaki」をAI OCRエンジンに採用。大量の紙資料やPDFなどの画像データをテキストデータ化し、検索など活用できる状態にするという。
サービス概要(出典:TIS)
Tegakiを開発、運営するCogent Labsと共同で展開する、業務デジタル化事業の第1弾で、「テキスト領域の自動検知」「高精度なAI-OCRによるテキストデータ化」「辞書機能を活用した補正機能」を特長とするという。
読み取り領域の事前指定が不要で、非定型フォーマット書類が簡単に電子化できると説明。テキスト化したデータは補正可能で、通常の言語モデルでの補完が難しい業界用語、化学物質名、企業用語などは辞書登録も可能。
構成イメージ(出典:TIS)
検索画面イメージ(出典:TIS)
読み取り帳票の量に応じた従量課金制。税別月額利用料金は10万円から。
TISは今後、AI OCRを活用したサービスをCogent Labsやそのほかの協賛企業と提供していくという。今春には帳票振り分けサービスを予定。また、トランザクト(渋谷区)のインターネットファクスサービス「TransFax」、UiPath(千代田区)のRPAツールなどと連携してサービスを展開していくとしている。