富士通研、非定型帳票の自動解析技術を開発--帳票のデータ入力コストを6割低減

ニューズフロント 2006年10月17日 18時59分

  • このエントリーをはてなブックマークに追加

 富士通研究所は10月16日、見積書や納品書など多様なレイアウトの帳票を自動解析する技術を開発したと発表した。非定型の帳票からでも「氏名」や「帳票番号」といった見出しに対応するデータを読み取るため、手作業に頼っていたデータ入力のコストを大幅に削減できるという。

 これまで同社が開発してきた非定型帳票の自動解析技術では、あらかじめ見出しデータベースに登録してある「氏名」のような文字列を帳票から読み取り、その見出しの位置から一定の範囲内にある文字列を対応するデータとして認識していた。

 しかしこの技術は、見出しとデータとを事前に登録した位置関係から探索するため、多様なレイアウトの帳票に適用するのが難しかった。また複雑な階層の見出しや、見出しの抜けがある帳票では文字列を正しく認識できないという問題があった。

 新技術では、見積書や納品書など帳票の種類ごとに、見出しやデータといった「論理要素」に対応する文字列の特徴と、論理要素間の関係を定義したパターンをデータベースに登録する。論理要素間の関係を確率ネットワークとして表現し、そのネットワーク上で確率を伝搬させることで、帳票から最も適切な文字列を読み取る。

 事前に見出しやデータの位置関係を登録する必要がなく、多様なレイアウトの帳票に対応できる。また文字認識の誤りを類推したり、省略された論理要素を検出することができ、見出しの抜けや階層型の見出しがある帳票から安定して文字列を認識できるという。

 富士通研の実験に基づく試算では、手作業による非定型帳票からのデータ入力作業コストを約60%削減できるという。2007年度には、富士通の電子文書/内部統制関連システム向け光学文字認識(OCR)ソフトやスキャナといった製品に搭載を始める予定。

  • このエントリーをはてなブックマークに追加
関連キーワード
ビジネスアプリケーション

関連ホワイトペーパー

SpecialPR

連載

CIO
ハードから読み解くITトレンド放談
大木豊成「仕事で使うアップルのトリセツ」
研究現場から見たAI
ITは「ひみつ道具」の夢を見る
内製化とユーザー体験の関係
米ZDNet編集長Larryの独り言
今週の明言
「プロジェクトマネジメント」の解き方
田中克己「2020年のIT企業」
松岡功「一言もの申す」
林 雅之「デジタル未来からの手紙」
谷川耕一「エンプラITならこれは知っとけ」
Fintechの正体
内山悟志「IT部門はどこに向かうのか」
情報通信技術の新しい使い方
三国大洋のスクラップブック
大河原克行のエンプラ徒然
コミュニケーション
情報系システム最適化
モバイル
通信のゆくえを追う
セキュリティ
企業セキュリティの歩き方
サイバーセキュリティ未来考
セキュリティの論点
ネットワークセキュリティ
スペシャル
Gartner Symposium
企業決算
ソフトウェア開発パラダイムの進化
座談会@ZDNet
Dr.津田のクラウドトップガン対談
CSIRT座談会--バンダイナムコや大成建設、DeNAに聞く
創造的破壊を--次世代SIer座談会
「SD-WAN」の現在
展望2017
IBM World of Watson
de:code
Sapphire Now
VMworld
Microsoft WPC
HPE Discover
Oracle OpenWorld
Dell EMC World
AWS re:Invent
AWS Summit
PTC LiveWorx
古賀政純「Dockerがもたらすビジネス変革」
さとうなおきの「週刊Azureなう」
誰もが開発者になる時代 ~業務システム開発の現場を行く~
中国ビジネス四方山話
より賢く活用するためのOSS最新動向
「Windows 10」法人導入の手引き
Windows Server 2003サポート終了へ秒読み
米株式動向
実践ビッグデータ
日本株展望
ベトナムでビジネス
アジアのIT
10の事情
エンタープライズトレンド
クラウドと仮想化