No.3ベストアンサー
- 回答日時:
1)単純な2値化処理(白と黒に分離)もしくは濃淡の変化点から文字の切り出しを行う
文字と背景の分離(文字をひとつの連続した塊として認識しその境界線を探し、矩形でエリアを求める)
2)切り出した文字の塊をベクトル化や交点位置情報や端点位置情報等のデーターベース化した辞書と比べる
3)比べた辞書で一番スコア(似ている)辞書文字を出力する
誤認識として 数字の「8」と英字の「B」等は変化点が近時の文字は文字の大きさが小さいと分解したときに変化が無いので誤認識しやすい。
たとえば1文字幅が1インチの大きさのとき10DPIで取り込めば横は1/10の枡で区切った方眼紙で表現できるだけの情報量ですが、100DPIでとると1/100で変化が大きくなる。
大きな文字を高分解能でスキャンすれば誤認識率が改善される。
郵便局の郵便番号OCRは対象文字が0~9までだけなので辞書が少なくすむことと、OCR部分だけでも1台数千万円するのでパソコンとは比較しがたい・・・
No.2
- 回答日時:
こんばんは
OCR技術の簡単なフローは、以下のような内容です。
1)スキャン
2)スキャンしたデータを文字とそれ以外に分解
3)文字を部首や作りに分解
4)辞書検索
5)文体などから一番近い文字を割り当てる
OCRで重要なものは、もちろん文字認識力なのですが、辞書とそれを検索する検索エンジンが最も重要なのです。
ナチュラルな日本語文章は、文字の配列をパターン化することができません。
そのため、どれほどナチュラルな言葉の辞書を持っているか、それを以下に速く検索し的確に割り当てが行えるか、ここがOCRの重要なポイントです。
一方、住所の認識は実は簡単です。
その理由は、住所は有限(約12万件)で階層化できるため、パターンを決定しやすいからです。
例えば、「東京都」に続く文字列は、東京都○○区に限定されます。文字を多く認識できれば、それだけ精度を高めることができるからです。
参考URL:http://www.hammock.jp/ocr/jp_ocr_04.html
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- ノートパソコン word2013で文字が打てなくなりました 質問です word2013を使っているのですが、突然文字 4 2023/01/08 18:46
- その他(音楽・ダンス・舞台芸能) Garage Bandで、作った曲を聞こうとしてもこのような画面が出てきて聞けません。 1 2023/06/18 21:44
- その他(プログラミング・Web制作) プログラミング python pandas 固定長データの出力 2 2022/08/16 11:22
- 会社・職場 輸出について 2 2023/02/02 00:17
- Excel(エクセル) PowerQueryに詳しい方教えてください(Office365) 1 2022/07/24 21:11
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- その他(ソフトウェア) PDFファイルのサイズを小さくする方法を教えてください。 4 2023/07/23 14:59
- C言語・C++・C# [C言語] コメント文字列を無視して、数値データを読み込むプログラム部分について 5 2022/10/05 11:03
- アプリ 【ChatGTP】Androidアプリで1番おすすめのChatGTPアプリを教 1 2023/03/10 06:55
- 認知障害・認知症 認知症を理解出来る 分かりやすい本や漫画本のお薦めを教えて下さい または、分かりやすいHPサイトも有 1 2022/08/28 18:40
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
多岐にわたる、は、亘る OR ...
-
「はや」の表記
-
「等々」は「とうとう」「など...
-
「以上」と「超」の意味の違い
-
「拠点」と「拠店」の意味の違...
-
「一言一句」「一字一句」と「...
-
経験を活かす?それとも生かす
-
七面六臂(しちめんろっぴ)に...
-
出費多難と出費多端
-
エクセルで「印」のしるしを書...
-
「恩恵にあずかる」は「与る」...
-
「世界を周る」のまわるの漢字...
-
文量は正しい日本語ですか?
-
「~より」と「~から」
-
合意の上・下の使い分け
-
「できるか、できないか」を熟...
-
意味から単語を調べるには…
-
ラテン語で「繋ぐ」をおしえて...
-
「翔」の字の読み方
-
辞書に載ってないけど「自慢気...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
多岐にわたる、は、亘る OR ...
-
「等々」は「とうとう」「など...
-
「以上」と「超」の意味の違い
-
「はや」の表記
-
エクセルで「印」のしるしを書...
-
七面六臂(しちめんろっぴ)に...
-
経験を活かす?それとも生かす
-
「一言一句」「一字一句」と「...
-
「拠点」と「拠店」の意味の違...
-
「~より」と「~から」
-
文量は正しい日本語ですか?
-
合意の上・下の使い分け
-
「恩恵にあずかる」は「与る」...
-
「できるか、できないか」を熟...
-
向かい入れる? 迎い入れる?
-
「終わる」でも良くなったの?...
-
「世界を周る」のまわるの漢字...
-
ラテン語で「繋ぐ」をおしえて...
-
「毎」の読み方
-
辞書に載ってないけど「自慢気...
おすすめ情報