現在CANONのPIXUSMP370というプリンター兼スキャナーを使用しております
ソフトはe.Typistのエントリーを使用しております
印刷文をOCRでスキャンし、
テキストデータにしたいのですが
(PC内で改変できるtextファイルです、画像ではありません)
OCRの精度が悪く
意味不明の文字が多数出てきます
例えば
http://www.abc.com
というURLが印刷物にあったとしたら
OCRはhttp://wwwabccom
というように認識してしまいます
もっと精度の高いOCRが欲しいのですが
どうすれば良いのでしょうか?
良いスキャナーに変える、あるいは
良いOCRソフトに変えるのでしょうか?
また、お勧めがあったら教えてください
よろしくお願いします
No.3ベストアンサー
- 回答日時:
AIソフトの「読んでココ!」と言うソフトが認識率95%以上と高いですが、残り数%がくせ者です。
数万円で買えるOCRソフトではAIソフトの物が今のところ一番優秀かな?
スキャナ自体は問題ないですが、読み取り解像度が低すぎると認識率は悪くなります。
No.6
- 回答日時:
下手にスキャナの解像度を上げると、字体や文字の大きさ、原稿の状態によっては、かえって誤認識が増えますね。
(体験談)お使いのマシンの解像度や解像度の変更が可能かわかりませんのでなんともいえませんが、解像度を落とすことで認識率が上がる原稿もあります。
変えるならソフトでしょうが、高度なソフトはそれだけ、PC本体のマシンパワーが必要になります。
私は、3~4年前に買ったe.typistで満足しているというか、この程度だろうと諦めてますので・・・
No.5
- 回答日時:
当該機を所有していないので一般論となりますが、No4氏と基本的には同じで、経験的には解像度が認識率にかなり効きます。
あと、
○読み込ませるとき水平垂直を正確にする。
読み取りエンジンによっては傾きに弱いものがあったりするようです。
○読み取り時の暗い明るいを調整する。
印刷物の地色が暗いものだったりすると読み込み時のバックグランドノイズが増えて、質問者例示のようなドットをノイズと誤認したり、逆にノイズをドットやカンマと誤認したりすることがあります。
○読み込み時ガラスに密着させる。
特に書籍ものの場合閉じている部分がガラスから離れるため、スキャナの被写界深度が浅いとボケますし、読み取り画像も歪むので認識率に影響を与えます。
他の回答者も言及していますが、認識率にはある程度限界がありますし、誤認した部分が結構ポイントになったりします。
それを理解した上で各種調整などで認識率を向上させるのが良策かと思います。
No.4
- 回答日時:
プリンタの修理屋です。
#2さんに一票。
MP370は(失礼ですが)比較的ローグレードな機種ですがスキャナの能力は充分なはずです。
対策としては原稿台のガラスを掃除する。(ホコリなどがあるとそれも込みで変換しますので)
解像度を上げる、などでしょう。
ただ、どこまで行っても付いて回る問題でしょう。
30年もまえだと「パターン認識」はコンピューターには不可能と言われていて、基本的には現在でも変わっていないように思います。
ソフトの進化で似たような作業が可能になってきているわけですが、
昔を考えると、たいした進化だと感心します。
No.2
- 回答日時:
MS-DOSの時代からもうかれこれ20年近くOCRを使っています。
自信を持って断言できます。「不可能」だと。
画像データから判断して文字データに変換するという方法をとっている限り、人間の目でさえ誤読があります。ましてや「機械」の場合は、推して知るべしではないでしょうか。
ただ、ほとんどのOCRソフトには、学習機能が備わっています。これを活用することにより、ある程度の精度アップは可能でしょう。
No.1
- 回答日時:
ん~難しいですね・・・・OCRは
原稿の鮮明度とOCRソフトの精度でしょうか?
スキャナの精度はそんなに影響しないような気がしますが。
私も時々使いますが、手入力の方が早い事もありますね。。。
回答でなくすみません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- プリンタ・スキャナー scansnap 1 2022/12/31 11:38
- PDF OCR処理したPDFの結合 1 2023/07/13 18:22
- その他(ソフトウェア) PDFファイルのサイズを小さくする方法を教えてください。 4 2023/07/23 14:59
- PDF Adobe Acrobat DCでは複数のPDFをOCR化できますか? 2 2022/04/19 15:25
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- プリンタ・スキャナー 【至急】EPSON EP-808AB プリンターUSBメモリーが反応しない 3 2022/06/12 01:13
- プリンタ・スキャナー scansnap OCR 2 2022/12/31 17:30
- アプリ 【ChatGTP】Androidアプリで1番おすすめのChatGTPアプリを教 1 2023/03/10 06:55
- LINE 自分で描いた絵を修正・編集・加工してLINEスタンプや添付・年賀状・ポスター等にしたいです。 1 2022/06/12 02:59
- Google Drive GoogleドライブOCR機能が使えない 画像を右クリックでテキストを出そうとやってみたのですがドキ 6 2023/05/28 20:22
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
エクセルVBAで画像から文字を抽...
-
Office2007にOCRソフトは付属し...
-
スキャナーからJPEGで取り込み...
-
スキャナから取り込んだファイ...
-
PDFファイルの作り方を教えてく...
-
大きい写真をスキャナーするとき
-
スキャナで取り込んだ文章をワ...
-
普通のスキャナでネガフィルム...
-
パソコンにプリンターからスキ...
-
アドレス記号の読み方を教えて!!
-
厚い本を見開きコピーする上手...
-
プリンターでスキャンした書類...
-
グラボのドライバーが互換性が...
-
「複合機」は英語でなんと言う?
-
画像やスクショしたものをスキ...
-
windows11でクイックスキャン等...
-
コピーと原本の見分け方
-
コンビニのコピー機を10分以上...
-
スキャナーの設定をする時にSMB...
-
abmファイルを開くまたは変換す...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
エクセルVBAで画像から文字を抽...
-
スキャナーからJPEGで取り込み...
-
普通のスキャナでネガフィルム...
-
スキャナーで読取ったフォーム...
-
PDFファイルの作り方を教えてく...
-
楽譜をスキャンしてXMLファイル...
-
紙の書類をパソコンに入れたい
-
OCRソフトを使って原稿用紙...
-
Canonスキャナが使えないので困...
-
スキャナで読み取って翻訳する方法
-
OCR
-
A4プリントをパソコンに取り込...
-
手書き文字・図形をPDF化
-
Macで自炊したpdf書籍のオスス...
-
PDFからエクセルへの変換につい...
-
スキャナで取り込んだPDFファイ...
-
スキャナで取り込んだ画像の劣化
-
ノートンインターネットセキュ...
-
Canonのスキャナ使用際に困って...
-
鷲の絵をGIFで作製したい!
おすすめ情報