パソコンの画面に表示されている文字をOCRソフト(読んでココ!)で認識しようとしていますが、
画面のキャプチャ(Fn+Alt+PrintAcreen)の解像度粗いため文字認識の精度が悪く困っています。
このため、以下のようにしてOCRの精度向上を目論もうと考えていますが
考え方はあっているでしょうか?
また、もっと良い方法はないものでしょうか?
OCRに読み込ませる前にキャプチャ画像を以下のように加工する
(1)2値化を行う
(2)画面解像度(dpi)を上げる
(3)文字のガタガタを滑らかにする
※文字のガタガタを滑らかにする方法の名称(手法)を教えて頂けると
ありがたいです。(OpenCVで、挑戦します)
よろしくお願いします
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
もう解決済みかもしれませんが、
2011/9/30より
MSがMS-officeのツールを無償ダウンロードできるようにしています(条件等の詳細未確認)。
Microsoft Office Document Imaging(MODI)をダウンロードしてお使いください。
画面をTiff(文字情報つき)で出力し、MODIで開くと文字化けなしで画面のテキストデータを抽出することが可能です。
AcrobatのOCRではできない表の列単位のコピーも可能ですし、
読んde!!では表にすると行ごとに罫線を入れないと1行単位の表にならないのが、
MODIでは何の操作もなしに1行ごとの表を出力することが可能になります。
もともとこのツールはMS-Officeに付属していたのですが
Office2010で付属しなくなり、
クレームが相次いだのか、Office2010ユーザーでも使えるようになったものと思います。
特に注意書きもなかったので、officeユーザーでなくとも利用できるのではないでしょうか?
No.1
- 回答日時:
OCR を使う時の元データは 300DPI 程度必要、と聞いたことがあります。
印刷物の文字高さを見るとおよそ 3mm 、300DPI なら 35~45ドットという計算です。
普段画面に表示される文字を調べると15ドットしかありません。
Webブラウザなら表示文字を大きくして文字を表現するドット数を増やす必要があると思います。
(IE なら <Ctrl>+マウススクロールノブ上下 で簡単に変わります)
1画面の総文字数が減るので作業の手間が増えることになります。
(可能なら画面モード設定を変更し画面の総ドットを増やせば多少マシですが)
元々がビットイメージで、拡大しても使用ドット数が増えるわけでないなら以上の手は使えませんが。
2値化、スムージングによる認識精度向上効果はわかりません。
http://d.hatena.ne.jp/keyword/%A5%B9%A5%E0%A1%BC …
尚、画面に表示された文字を取得するソフトを使う手もあります。
どんな場合でも取得できるわけではないし、ビットイメージなら不可ですが、結構使えます。
ベクターや窓の杜での適当な検索キーワードがわからないので検索できてませんが、
以前探した時はいくつか見つかったものです。
少し使ったことがあるのがこれ。
http://www.vector.co.jp/soft/winnt/util/se271444 …
ご丁寧なご指導ありがとうございます。
やはり必要なDPIを確保しないと、精度が上がらないのですね。
画面の拡大などを、裏側(画像取得後)で行うことを考え
2値化→拡大→スムージング→2値化の流れを想定していました。
また、Windows画面からのデータ取得ソフト」ありがとうございました。
□Windows標準のメッセージを使用して、以下のコントロールまたは、それを継承したコントロールからテキストを取得できます。
コンボボックス:CB_GETCOUNT⇒CB_GETLBTEXTLEN⇒CB_GETLBTEXT
リストボックス:LB_GETCOUNT⇒LB_GETTEXTLEN⇒LB_GETTEXT
リストビュー:LVM_GETITEMCOUNT⇒LVM_GETITEMTEXT
ツリービュー:TVM_GETCOUNT⇒TVM_GETITEM
その他:GetWindowTextLength⇒GetWindowText
ただし、完全に確かめたわけではありませんがWindows7では
正常に動作しないようです。
スムージングに関しては、試してみます。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- 画像編集・動画編集・音楽編集 このようなスクリーンキャプチャソフトありますか? 3 2023/01/31 16:02
- ノートパソコン Windows10の音声入力について 1 2023/02/17 07:43
- Evernote Evernote(エバーノート)の文字化け 1 2022/04/05 19:30
- その他(パソコン・周辺機器) 解像度が低いモニターの動画を高いモニターで再生した際の画質劣化の対応策を教えてください 9 2023/08/22 15:14
- Photoshop(フォトショップ) 【大至急】写真加工に強い方、お願いします。 現在、自作のブックカバーをプリンパさんに依頼しています。 6 2023/06/10 11:51
- 政治 私の発明した「二階建て漢字」は使えるでしょうか? 3 2023/02/08 16:40
- その他(ブラウザ) bingチャットの内容(縦長)をスクリーンショットで保存する方法 3 2023/02/28 02:13
- WordPress(ワードプレス) ワードプレスで、左寄せ画像と文字を横並びにせず、画像の下に文字を表示される方法を教えてください 1 2022/04/24 11:06
- 画像編集・動画編集・音楽編集 Filmoraの自動字幕起こしが上手くいかず困ってます 1 2023/04/05 08:54
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
1MBでドレくらいの文章を書くこ...
-
A4のレポート用紙1枚で2000文字...
-
スペイン語で「i」や「o」の上...
-
作ったマクロを複数のシートで...
-
ペイントでのテキスト修正
-
Notionが、テーブルビューを一...
-
マル秘マークを入れたい
-
フォトショップで、スキャナ取...
-
ラテン文字(aなどの上に点が二...
-
ラベルマイティの使い方で
-
Lotsu Notes7 同一文章内リン...
-
TeraPadで環境依存文字を入力す...
-
Inkscapeで文字を変形するには
-
4個の文字a,b,b,cから3個の文字...
-
キーボードで入力した文字を読...
-
フォトショ 縦書き
-
RIGHTの関数で、指定した文字数...
-
このように文字の内容を変える...
-
10分間で1200文字打てる...
-
フォトショップ 文字入力ツー...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
1MBでドレくらいの文章を書くこ...
-
作ったマクロを複数のシートで...
-
Notionが、テーブルビューを一...
-
WPS OFFICEでの縦書きについて
-
4個の文字a,b,b,cから3個の文字...
-
スペイン語で「i」や「o」の上...
-
パワーポイント、四角い枠の中...
-
photoshop(CS6)の文字入力問題
-
フォトショップで、スキャナ取...
-
VB6 String型変数の文字数制限
-
テキスト型は何故255文字ま...
-
ラテン文字(aなどの上に点が二...
-
英文の字下げ、について
-
ペイントでのテキスト修正
-
マル秘マークを入れたい
-
イラストレーターで、円に沿っ...
-
イラストレーターで、文字ツー...
-
TeraPadで環境依存文字を入力す...
-
Inkscapeで文字を変形するには
-
ペイントでテキストを入れると...
おすすめ情報