プロが教える店舗&オフィスのセキュリティ対策術

OCRで文書をスキャンすると文字を認識して読み込みますが、なぜ画像としてではなく文字として読み込むことが出来るのでしょうか?その原理はどうなってるのでしょうか?ご存知の方がいらっしゃいましたら、教えていただきたいと思います。よろしくお願いします。

A 回答 (3件)

1)単純な2値化処理(白と黒に分離)もしくは濃淡の変化点から文字の切り出しを行う



文字と背景の分離(文字をひとつの連続した塊として認識しその境界線を探し、矩形でエリアを求める)

2)切り出した文字の塊をベクトル化や交点位置情報や端点位置情報等のデーターベース化した辞書と比べる

3)比べた辞書で一番スコア(似ている)辞書文字を出力する

誤認識として 数字の「8」と英字の「B」等は変化点が近時の文字は文字の大きさが小さいと分解したときに変化が無いので誤認識しやすい。
たとえば1文字幅が1インチの大きさのとき10DPIで取り込めば横は1/10の枡で区切った方眼紙で表現できるだけの情報量ですが、100DPIでとると1/100で変化が大きくなる。
大きな文字を高分解能でスキャンすれば誤認識率が改善される。

郵便局の郵便番号OCRは対象文字が0~9までだけなので辞書が少なくすむことと、OCR部分だけでも1台数千万円するのでパソコンとは比較しがたい・・・
    • good
    • 0
この回答へのお礼

回答をしていただき、どうもありがとうございました。

詳しい回答で、原理の概略が理解できました。助かりました。

お礼日時:2004/12/19 17:25

こんばんは


OCR技術の簡単なフローは、以下のような内容です。

1)スキャン
2)スキャンしたデータを文字とそれ以外に分解
3)文字を部首や作りに分解
4)辞書検索
5)文体などから一番近い文字を割り当てる

OCRで重要なものは、もちろん文字認識力なのですが、辞書とそれを検索する検索エンジンが最も重要なのです。

ナチュラルな日本語文章は、文字の配列をパターン化することができません。
そのため、どれほどナチュラルな言葉の辞書を持っているか、それを以下に速く検索し的確に割り当てが行えるか、ここがOCRの重要なポイントです。


一方、住所の認識は実は簡単です。
その理由は、住所は有限(約12万件)で階層化できるため、パターンを決定しやすいからです。
例えば、「東京都」に続く文字列は、東京都○○区に限定されます。文字を多く認識できれば、それだけ精度を高めることができるからです。

参考URL:http://www.hammock.jp/ocr/jp_ocr_04.html
    • good
    • 0
この回答へのお礼

回答をしていただき、どうもありがとうございました。

OCRの手順の概略を理解することができました。

お礼日時:2004/12/19 17:28

文字として読み込むのではなく、


いったん画像として読み込んで、白(紙)と黒(文字)の違いを識別して、文字の画像部分を解析して、一番近い文字の形を文字データとして保存するってだけです

パソコン向けのOCRはそんなに精度はよくないですが、郵便局などにあるものは化け物的な処理速度と精度があります。

不特定多数の人が手書きで書いた文字を1分間に数万通という速さで処理してるわけですからね(^^)v
    • good
    • 0
この回答へのお礼

回答をしていただき、どうもありがとうございました。

OCRの流れを理解することができました。

お礼日時:2004/12/19 17:27

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!