
スキャンしたPDFをエクセルに変換する精度
教えてださい。
大量に郵送されて来る紙ベースの請求書を複合機でスキャンして保存しています。
この各10ページが1PDFになっている請求書をエクセルに変換したいと考えています。
色々と調べるとフリーソフトもあり、試してみましたがもじばけなどがあり、精度があまりよくありません。Adbeをアップグレードすれば変換できるときいたのですが精度はかなり高いのでしょうか?
有償 無償問わず確実にエクセルに変換できるソフトがあればご教示ください。主に行列の入れ替えなどに使いたいと考えています。
よろしくお願い致します。
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
こんにちは。
ご質問者の質問を、私は、紙ベースの請求書の保存をPDF電子化とEXCELに記帳と両方をしようとしているように読みました。
PDFからEXCELファイルに変換するのは、PDFそのものの画像の質の問題など他の要素も加わります。PDF化するところから始まりますが、EXCELに転送するなら、直接、請求書をデータ化したほうが早いです。
OCRの精度そのものは、それを作った時の問題と技術的なものが影響します。OCRには手書き専用というようなものもあるそうですが、最初に、おそらく面倒な作業がくわわるような気がします。もしかしたら違っているかもしれません。
認識率については、私の愛用する、ABBYY FineReader と、国産の二種、読取革命・eTypist (どちらも現行バージョン)と比較すると、圧倒的にFineReadertが上ですが、そもそも考え方の違いがあり、国産の二種はテキスト起こしには優れているけれども、PDF化にはとても間に合いません。
PDF化は、その中にTEXT(検索文字/透明文字)を入れるにしても、その認識よりも使えるPDFの生成がどれだけ速いかで決めています。それ以上の精度は開き直るしかないと思います。
#3様のスキャナー購入時についてくるOCRは、何か分かりませんが、私の場合は付属ソフトは、2つとも使い物にはなりませんでした。OCRは、複合プリンターを含め、3台あります。
手軽に高性能のOCRを味わいたいのでしたら、Google Document が良いのです。しかし、手数が多すぎて、実用には向かないように思っています。これを利用した、OCRが市販ソフト(パパっと読み取りOCR)が出ていますが、簡易版は、文字化けして、まったく使い物にはなりません。
ここまでは、スキャナー・OCRの話です。
-----
請求書を電子化する話は、まったく違う次元かもしれません。法律があるからです。会計システムの中のOCRは、業務で使うものと、個人で使うものとは、そのレベルや精度が違います。失礼ながら、大企業の大量処理ではないようなので、個人事業主か中小企業で使う中間的なものとして考えました。
>大量に郵送されて来る紙ベースの請求書を複合機でスキャンして保存しています。この各10ページが1PDFになっている請求書をエクセルに変換したいと考えています。
PDFにするのと、エクセルのファイルにするのとは別のタスクだと思います。
PDFにしても、原本は、『e-文書法』に則れば廃棄して構わないそうですが、本格的なものになりそうです。
https://www.pfu.fujitsu.com/imaging/downloads/ma …
スキャナーは、両面自動給紙タイプの富士通の“ScanSnap iX500”、今年(2019年)の新モデル(iX1500)が便利かとは思います。Epson DS-570w (w =Wi-Fi)
ただ、OCRは、個人経営などの方は、専用アプリを使っていると聞きます。YouTube では、“Freee” というアプリを聞きました。
https://www.freee.co.jp/kakuteishinkoku/?utm_sou …
会計ソフト一覧
https://biz-owner.net/soft/
もう少し上のクラスになると、例えば、“RICOH Cloud OCR” などクラウド型にしているようです。
EXCELについては、特殊なマクロを組んであげられれば一覧なども便利にもなるものの、そんなマクロを組める人は、極めて少ないと思います。理由は、テキスト処理だからで、VBAマクロ以外の知識が必要だからです。
No.1
- 回答日時:
(私は情報システムの仕事をしていてOCRも扱いましたのでよく知ってますが)
>エクセルに変換できる
その前に 文字がちゃんとよみとれてテキストデータ(文字データ)にできることが必要です。しかし...
入力枠(たとえば郵便番号のオレンジ色の枠)のない手書き伝票では、OCR(光学文字よみとり)の精度は実用になりません。
入力枠のちゃんとついた伝票で英数文字だけならかなりの認識率になります。これではじめて実用になります。
しかし、「こちらから指定した入力枠のある伝票」を作るのもお金がかかります。そこまでやりますか? 数百万は見ておいてください。大量に来るのなら投資効果もあるでしょう。
まずはシステム屋さんに相談しましょう。OCRはNECが一番だと思います。
経験のあるシステム屋さんに全体の仕組みを作ってもらえば、すごい省力化になります。郵送じゃなくてFAXでもよくなります。
「Excelに入力」じゃなくって何かのシステムに直接データを送ればいいと思います。
(化粧品の通信販売でそういうのをみたことありませんか?)
ちまたに「識字率99.5%!どんな手書きでも読める」なんて言ってるのはウソ(誤読だらけです)です。惑わされてはいけません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Win10での文字認識に関する質問
-
スキャンしたPDFをエクセルに変...
-
紙ベースの文章をワードにする
-
文章のスキャン方法について教...
-
WindowsXPでしか動かなかった...
-
変更前のコンピュータ名を調べ...
-
スタートアップにSBSVというの...
-
NET Broadcast Event Window
-
のぎへんに「豊」と書いて何と...
-
質問は2つです。 Sma4winという...
-
PDFの切り取り
-
PDFに変換したものに線がはいる...
-
右上に出る「最小化」「最大化...
-
ディーエルソフトでソフトを購...
-
CRFファイルの開き方
-
SyncToyみたいなファイル・フォ...
-
2ページのワード文書を1ページ...
-
同じフォルダ内の画像を連続し...
-
WAV録音→MP3など
-
中学校では見れない!?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Win10での文字認識に関する質問
-
pngをtxtへ変換の仕方
-
PDFとは??
-
PDFファイルが編集できません。
-
スキャンしたPDFをエクセルに変...
-
原稿用紙の内容をコピーしたい
-
スキャナで読み込んだ文書をワ...
-
パワーポイントで作成されたPDF...
-
紙に書いてある文字をスキャン...
-
OCRについて教えて下さい。
-
スキャンした書類に文字を入れ...
-
紙ベースの文章をワードにする
-
WindowsXPでしか動かなかった...
-
NET Broadcast Event Window
-
PDFの切り取り
-
hotmail.comと@hotmail.co.jp
-
同じフォルダ内の画像を連続し...
-
変更前のコンピュータ名を調べ...
-
2ページのワード文書を1ページ...
-
VLC media playerで複数の音声...
おすすめ情報