プライム・ストラテジー株式会社はコラム「紙の請求書は環境に有害です(2) | ハイパーオートメーションを支える技術」を公開しました。
###
今回は紙の請求書をどのようにデジタル化・構造抽出するかについて確認していきたいと思います。
紙のデジタル化といえば、「OCR」ですので、今回はOCRと請求書について掘り下げていきます。
OCRとは
まずOCRとは何の略かというと
Optical Character Recognition(日本語では「光学文字認識」)
の略です。活字、手書きテキストの画像を文字コード(デジタルデータ)に変換するソフトウェアや技術を指します。
OCRの歴史は意外にも古く1920年代に研究・開発され、1929年にはアメリカで数字とアルファベットを読み取るOCRがそれぞれ開発され特許が出願されています。
日本においては1960年代に郵便物の仕分けのために大量の人員が動員されており、これを解決すべく郵便番号制度の検討とOCRの研究がスタートしました。日本では住所で使われる「漢字」の読み取りが難しいため、郵便番号制度とOCR機器の開発を同時に進める必要がありました。そして1968年7月に郵便番号制度が導入され、同月に東芝が国産OCRを初めて製品化し、本格的にOCRの利用が始まりました。
この続きは以下をご覧ください
(リンク »)
今回は紙の請求書をどのようにデジタル化・構造抽出するかについて確認していきたいと思います。
紙のデジタル化といえば、「OCR」ですので、今回はOCRと請求書について掘り下げていきます。
OCRとは
まずOCRとは何の略かというと
Optical Character Recognition(日本語では「光学文字認識」)
の略です。活字、手書きテキストの画像を文字コード(デジタルデータ)に変換するソフトウェアや技術を指します。
OCRの歴史は意外にも古く1920年代に研究・開発され、1929年にはアメリカで数字とアルファベットを読み取るOCRがそれぞれ開発され特許が出願されています。
日本においては1960年代に郵便物の仕分けのために大量の人員が動員されており、これを解決すべく郵便番号制度の検討とOCRの研究がスタートしました。日本では住所で使われる「漢字」の読み取りが難しいため、郵便番号制度とOCR機器の開発を同時に進める必要がありました。そして1968年7月に郵便番号制度が導入され、同月に東芝が国産OCRを初めて製品化し、本格的にOCRの利用が始まりました。
この続きは以下をご覧ください
(リンク »)
本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。
お問い合わせにつきましては発表元企業までお願いいたします。

