アクセリアではディープラーニングをはじめとする機械学習技術を、金属プレートの文字読み取り、類似画像検索、トラフィックの異常検知に応用しています。
金属プレートの読み取りでは、CNN(Convolutional Neural Network)を用いて画像から テキスト位置の検出>行検出>文字位置検出・切り抜き>文字判定>文字出現確率による読み取りエラー修正 というように、何段ものニューラルネットワークをいくつも組み合わせて検出処理を行っています。
「文字が整然と並んだ文章が書かれた画像ファイルは、OCRの認識率ほぼ100%」
一般的にOCR(Optical Character Recognition/Reader)は簡単のように思えますが、文字認識はそんなに簡単ではありません。1文字であれば 手書き文字であっても高確率で正解を認識することができますが、多くの場合1文字ずつきれいに切り取れるとは限りません。
多くの場合で難しいのは、ノイズ(光の反射や傷、映り込みなど)が入っていて、文字の切れ目がわからない場合における文字位置検出です。「X」などの点の量が少ない(Xの中心点)文字も、文字切り取り位置において誤判定が多くなります。
現時点では、MicrosoftやGoogleなどのOCRサービスにそのまま金属プレートを渡しても、読み取り率は非常に低いです。対して、これらのOCRサービスに、文字が整然と並んだ文章が書かれた画像ファイルを送れば、認識率はほぼ100%となります。
・・・ここから先は、アクセリア株式会社で公開中のコラム本編でご覧ください。
(リンク »)
【アクセリア株式会社の研究開発部社員:東原 大記氏のコラム】
・第6回:アクセリアが手がけるP2P (Peer-to-Peer) (リンク »)
・第7回:効率的な検索を可能にする、グラフデータベース (リンク »)
【アクセリア株式会社の研究開発部社員:Norbert Preining氏のコラム】
・第1回:今さら聞けない、機械学習/ディープラーニングとは!? (リンク »)
・第2回:最新の機械学習の代表、ニューラルネットワークとは (リンク »)
・第3回:手書き数字を認識する機械学習 (リンク »)
・第4回:畳み込みニューラルネットワーク (リンク »)
・第5回:機械学習における今後の展開 (リンク »)
お問い合わせにつきましては発表元企業までお願いいたします。