本連載では、筆者が「気になるIT(技術、製品、サービス)」を取り上げ、その概要とともに気になるポイントを挙げてみたい。今回は、神奈川県がIIJグループの協力を得て実施した「AI OCRの活用に関する実証事業の結果」を取り上げる。
正確性、迅速性、継続性、操作性の4つの観点で検証
神奈川県は先頃、手書き文字を自動読み取りする「AI OCR」を活用して帳票情報のデジタル変換を自動化する実証事業を終え、その結果を公表した。業務効率の向上を目的としたもので、実施期間は2019年10月31日から12月16日まで。インターネットイニシアティブ(IIJ)とIIJエンジニアリングが協力した。
この実証事業では、「政治資金収支報告書」「漁獲量に関する送り状」「かながわの水源地域キャンペーンアンケート」の3帳票を対象とし、正確性、迅速性、継続性、操作性の4つの観点により、AI OCRの文字識読率や導入に向けた課題などを検証した。その結果は表1の通りである。
表1:検証結果(出典:神奈川県)
正確性(手書き文字を正確に読み取ったか)については、今回の実証事業で使用したAI OCRが推奨する300dpiの解像度で各帳票を読み取ったところ、政治資金収支報告書(5様式、170枚)の正読率は5様式の平均で96.93%、漁獲量に関する送り状(1様式、10枚)の正読率は68.04%、かながわの水源地域キャンペーンアンケート(1様式、100枚)の正読率は96.79%で、合計7様式の平均正読率は93.44%だった。
上記の中で、漁獲量に関する送り状の正読率が低いのは、水揚現場で記入された文字のため、職員の目視によっても判読が困難であったことが原因だとみられる。
正確性に関する課題と対応策としては、読み取り部分の付近に文字や記号が印字されているとAI OCRが誤認識するケースがあるので、読み取り部分と文字との間に十分余白を設けた帳票設計をする必要がある。また、帳票の所定の枠から文字がはみ出るケースや、任意で記載された「¥」まで読み取られてしまうケースがあったので、記入者への分かりやすい注意喚起が必要となる。
迅速性(手作業より迅速に処理できたか)については、かながわの水源地域キャンペーンアンケートをAI OCRと手作業それぞれ30枚分を処理した時間を計測し、1枚当たりの時間を算出した上で100枚分の時間に換算し比較した。その結果、手作業では93分を要したが、AI OCRでは70分となり、23分短縮できた。約75%の作業時間で済んだかたちだ。
迅速性に関する課題と対応策としては、AI OCRの読み取り処理の速さ自体は100枚の帳票の処理を5分で終えるスピーディなものだ。しかし、正読率が低い帳票の場合はその後の修正作業に時間を取られてしまうため、迅速性のメリットを損なわない帳票設計をする必要がある。