スキャンしたPDFをエクセルに変換する精度
教えてださい。
大量に郵送されて来る紙ベースの請求書を複合機でスキャンして保存しています。
この各10ページが1PDFになっている請求書をエクセルに変換したいと考えています。
色々と調べるとフリーソフトもあり、試してみましたがもじばけなどがあり、精度があまりよくありません。Adbeをアップグレードすれば変換できるときいたのですが精度はかなり高いのでしょうか?
有償 無償問わず確実にエクセルに変換できるソフトがあればご教示ください。主に行列の入れ替えなどに使いたいと考えています。
よろしくお願い致します。
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
こんにちは。
ご質問者の質問を、私は、紙ベースの請求書の保存をPDF電子化とEXCELに記帳と両方をしようとしているように読みました。
PDFからEXCELファイルに変換するのは、PDFそのものの画像の質の問題など他の要素も加わります。PDF化するところから始まりますが、EXCELに転送するなら、直接、請求書をデータ化したほうが早いです。
OCRの精度そのものは、それを作った時の問題と技術的なものが影響します。OCRには手書き専用というようなものもあるそうですが、最初に、おそらく面倒な作業がくわわるような気がします。もしかしたら違っているかもしれません。
認識率については、私の愛用する、ABBYY FineReader と、国産の二種、読取革命・eTypist (どちらも現行バージョン)と比較すると、圧倒的にFineReadertが上ですが、そもそも考え方の違いがあり、国産の二種はテキスト起こしには優れているけれども、PDF化にはとても間に合いません。
PDF化は、その中にTEXT(検索文字/透明文字)を入れるにしても、その認識よりも使えるPDFの生成がどれだけ速いかで決めています。それ以上の精度は開き直るしかないと思います。
#3様のスキャナー購入時についてくるOCRは、何か分かりませんが、私の場合は付属ソフトは、2つとも使い物にはなりませんでした。OCRは、複合プリンターを含め、3台あります。
手軽に高性能のOCRを味わいたいのでしたら、Google Document が良いのです。しかし、手数が多すぎて、実用には向かないように思っています。これを利用した、OCRが市販ソフト(パパっと読み取りOCR)が出ていますが、簡易版は、文字化けして、まったく使い物にはなりません。
ここまでは、スキャナー・OCRの話です。
-----
請求書を電子化する話は、まったく違う次元かもしれません。法律があるからです。会計システムの中のOCRは、業務で使うものと、個人で使うものとは、そのレベルや精度が違います。失礼ながら、大企業の大量処理ではないようなので、個人事業主か中小企業で使う中間的なものとして考えました。
>大量に郵送されて来る紙ベースの請求書を複合機でスキャンして保存しています。この各10ページが1PDFになっている請求書をエクセルに変換したいと考えています。
PDFにするのと、エクセルのファイルにするのとは別のタスクだと思います。
PDFにしても、原本は、『e-文書法』に則れば廃棄して構わないそうですが、本格的なものになりそうです。
https://www.pfu.fujitsu.com/imaging/downloads/ma …
スキャナーは、両面自動給紙タイプの富士通の“ScanSnap iX500”、今年(2019年)の新モデル(iX1500)が便利かとは思います。Epson DS-570w (w =Wi-Fi)
ただ、OCRは、個人経営などの方は、専用アプリを使っていると聞きます。YouTube では、“Freee” というアプリを聞きました。
https://www.freee.co.jp/kakuteishinkoku/?utm_sou …
会計ソフト一覧
https://biz-owner.net/soft/
もう少し上のクラスになると、例えば、“RICOH Cloud OCR” などクラウド型にしているようです。
EXCELについては、特殊なマクロを組んであげられれば一覧なども便利にもなるものの、そんなマクロを組める人は、極めて少ないと思います。理由は、テキスト処理だからで、VBAマクロ以外の知識が必要だからです。
No.1
- 回答日時:
(私は情報システムの仕事をしていてOCRも扱いましたのでよく知ってますが)
>エクセルに変換できる
その前に 文字がちゃんとよみとれてテキストデータ(文字データ)にできることが必要です。しかし...
入力枠(たとえば郵便番号のオレンジ色の枠)のない手書き伝票では、OCR(光学文字よみとり)の精度は実用になりません。
入力枠のちゃんとついた伝票で英数文字だけならかなりの認識率になります。これではじめて実用になります。
しかし、「こちらから指定した入力枠のある伝票」を作るのもお金がかかります。そこまでやりますか? 数百万は見ておいてください。大量に来るのなら投資効果もあるでしょう。
まずはシステム屋さんに相談しましょう。OCRはNECが一番だと思います。
経験のあるシステム屋さんに全体の仕組みを作ってもらえば、すごい省力化になります。郵送じゃなくてFAXでもよくなります。
「Excelに入力」じゃなくって何かのシステムに直接データを送ればいいと思います。
(化粧品の通信販売でそういうのをみたことありませんか?)
ちまたに「識字率99.5%!どんな手書きでも読める」なんて言ってるのはウソ(誤読だらけです)です。惑わされてはいけません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) PDFファイルに日付を名前にして保存したい。 エクセル2019でワークシートに請求書のフォームを作り 2 2023/05/27 11:13
- ノンジャンルトーク パソコン初心者です。ご教示願います。複合機でスキャンしたデータをパソコンのピクチャーホルダーに保存し 1 2023/07/09 11:13
- PDF いきなりPDFで文書の切り取り 3 2022/10/29 13:25
- PDF abode acrobat pro dc の文字編集教えてください 1 2022/09/15 09:58
- 財務・会計・経理 業者間での注文書・請書の取り扱いについて 2 2022/06/27 15:53
- PDF 紙で配布された、Excel dataを元のExcelに戻すには 4 2023/04/14 11:29
- PDF PDFファイルの変換ソフト 1 2022/06/10 13:46
- PDF 電子請求書を送ったら原紙をほしいと言われてしまいました 6 2023/06/09 12:04
- Visual Basic(VBA) エクセルのマクロについて教えてください マクロを実行して 作業フォルダの中にある PDFファイル名を 3 2023/07/01 15:16
- Photoshop(フォトショップ) Photoshop に代わるソフトはありますか? 5 2023/01/26 13:24
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
テキスト取りだし
-
スキャンしたPDFをエクセルに変...
-
PDF をワードやエクセルに変換...
-
WindowsXPでしか動かなかった...
-
動画編集ソフトについてです。 ...
-
同じフォルダ内の画像を連続し...
-
@live.jpと@hotmail.co.jpの違いは
-
hotmail.comと@hotmail.co.jp
-
のぎへんに「豊」と書いて何と...
-
フォートナイト エラー
-
PC買い替え:筆ぐるめソフトを...
-
PDFの切り取り
-
NET Broadcast Event Window
-
質問は2つです。 Sma4winという...
-
たなびく旗のアニメーションを...
-
画像の上の文字を消したい
-
aomei というソフトについて
-
iPhone版のフォトショップで腕...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
原稿用紙の内容をコピーしたい
-
スキャンしたPDFをエクセルに変...
-
スキャンした書類に文字を入れ...
-
PDFデーターをWord2013に落とし...
-
pngをtxtへ変換の仕方
-
PDF をワードやエクセルに変換...
-
OCRソフトでPDF形式の表を読み...
-
OCR
-
紙ベースの文章をワードにする
-
OCR
-
ブラザー7460DNでスキャンし...
-
PDFの切り取り
-
違法コピーはどうやってバレる?
-
WindowsXPでしか動かなかった...
-
hotmail.comと@hotmail.co.jp
-
のぎへんに「豊」と書いて何と...
-
NET Broadcast Event Window
-
フォートナイト エラー
おすすめ情報