
スキャンしたPDFをエクセルに変換する精度
教えてださい。
大量に郵送されて来る紙ベースの請求書を複合機でスキャンして保存しています。
この各10ページが1PDFになっている請求書をエクセルに変換したいと考えています。
色々と調べるとフリーソフトもあり、試してみましたがもじばけなどがあり、精度があまりよくありません。Adbeをアップグレードすれば変換できるときいたのですが精度はかなり高いのでしょうか?
有償 無償問わず確実にエクセルに変換できるソフトがあればご教示ください。主に行列の入れ替えなどに使いたいと考えています。
よろしくお願い致します。
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
こんにちは。
ご質問者の質問を、私は、紙ベースの請求書の保存をPDF電子化とEXCELに記帳と両方をしようとしているように読みました。
PDFからEXCELファイルに変換するのは、PDFそのものの画像の質の問題など他の要素も加わります。PDF化するところから始まりますが、EXCELに転送するなら、直接、請求書をデータ化したほうが早いです。
OCRの精度そのものは、それを作った時の問題と技術的なものが影響します。OCRには手書き専用というようなものもあるそうですが、最初に、おそらく面倒な作業がくわわるような気がします。もしかしたら違っているかもしれません。
認識率については、私の愛用する、ABBYY FineReader と、国産の二種、読取革命・eTypist (どちらも現行バージョン)と比較すると、圧倒的にFineReadertが上ですが、そもそも考え方の違いがあり、国産の二種はテキスト起こしには優れているけれども、PDF化にはとても間に合いません。
PDF化は、その中にTEXT(検索文字/透明文字)を入れるにしても、その認識よりも使えるPDFの生成がどれだけ速いかで決めています。それ以上の精度は開き直るしかないと思います。
#3様のスキャナー購入時についてくるOCRは、何か分かりませんが、私の場合は付属ソフトは、2つとも使い物にはなりませんでした。OCRは、複合プリンターを含め、3台あります。
手軽に高性能のOCRを味わいたいのでしたら、Google Document が良いのです。しかし、手数が多すぎて、実用には向かないように思っています。これを利用した、OCRが市販ソフト(パパっと読み取りOCR)が出ていますが、簡易版は、文字化けして、まったく使い物にはなりません。
ここまでは、スキャナー・OCRの話です。
-----
請求書を電子化する話は、まったく違う次元かもしれません。法律があるからです。会計システムの中のOCRは、業務で使うものと、個人で使うものとは、そのレベルや精度が違います。失礼ながら、大企業の大量処理ではないようなので、個人事業主か中小企業で使う中間的なものとして考えました。
>大量に郵送されて来る紙ベースの請求書を複合機でスキャンして保存しています。この各10ページが1PDFになっている請求書をエクセルに変換したいと考えています。
PDFにするのと、エクセルのファイルにするのとは別のタスクだと思います。
PDFにしても、原本は、『e-文書法』に則れば廃棄して構わないそうですが、本格的なものになりそうです。
https://www.pfu.fujitsu.com/imaging/downloads/ma …
スキャナーは、両面自動給紙タイプの富士通の“ScanSnap iX500”、今年(2019年)の新モデル(iX1500)が便利かとは思います。Epson DS-570w (w =Wi-Fi)
ただ、OCRは、個人経営などの方は、専用アプリを使っていると聞きます。YouTube では、“Freee” というアプリを聞きました。
https://www.freee.co.jp/kakuteishinkoku/?utm_sou …
会計ソフト一覧
https://biz-owner.net/soft/
もう少し上のクラスになると、例えば、“RICOH Cloud OCR” などクラウド型にしているようです。
EXCELについては、特殊なマクロを組んであげられれば一覧なども便利にもなるものの、そんなマクロを組める人は、極めて少ないと思います。理由は、テキスト処理だからで、VBAマクロ以外の知識が必要だからです。
No.1
- 回答日時:
(私は情報システムの仕事をしていてOCRも扱いましたのでよく知ってますが)
>エクセルに変換できる
その前に 文字がちゃんとよみとれてテキストデータ(文字データ)にできることが必要です。しかし...
入力枠(たとえば郵便番号のオレンジ色の枠)のない手書き伝票では、OCR(光学文字よみとり)の精度は実用になりません。
入力枠のちゃんとついた伝票で英数文字だけならかなりの認識率になります。これではじめて実用になります。
しかし、「こちらから指定した入力枠のある伝票」を作るのもお金がかかります。そこまでやりますか? 数百万は見ておいてください。大量に来るのなら投資効果もあるでしょう。
まずはシステム屋さんに相談しましょう。OCRはNECが一番だと思います。
経験のあるシステム屋さんに全体の仕組みを作ってもらえば、すごい省力化になります。郵送じゃなくてFAXでもよくなります。
「Excelに入力」じゃなくって何かのシステムに直接データを送ればいいと思います。
(化粧品の通信販売でそういうのをみたことありませんか?)
ちまたに「識字率99.5%!どんな手書きでも読める」なんて言ってるのはウソ(誤読だらけです)です。惑わされてはいけません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
今、見られている記事はコレ!
-
弁護士が解説!あなたの声を行政に届ける「パブリックコメント」制度のすべて
社会に対する意見や不満、疑問。それを発信する場所は、SNSやブログ、そしてニュースサイトのコメント欄など多岐にわたる。教えて!gooでも「ヤフコメ民について」というタイトルのトピックがあり、この投稿の通り、...
-
弁護士が語る「合法と違法を分けるオンラインカジノのシンプルな線引き」
「お金を賭けたら違法です」ーーこう答えたのは富士見坂法律事務所の井上義之弁護士。オンラインカジノが違法となるかどうかの基準は、このように非常にシンプルである。しかし2025年にはいって、違法賭博事件が相次...
-
釣りと密漁の違いは?知らなかったでは済まされない?事前にできることは?
知らなかったでは済まされないのが法律の世界であるが、全てを知ってから何かをするには少々手間がかかるし、最悪始めることすらできずに終わってしまうこともあり得る。教えてgooでも「釣りと密漁の境目はどこです...
-
カスハラとクレームの違いは?カスハラの法的責任は?企業がとるべき対応は?
東京都が、客からの迷惑行為などを称した「カスタマーハラスメント」、いわゆる「カスハラ」の防止を目的とした条例を、全国で初めて成立させた。条例に罰則はなく、2025年4月1日から施行される。 この動きは自治体...
-
なぜ批判コメントをするの?その心理と向き合い方をカウンセラーにきいた!
今や生活に必要不可欠となったインターネット。手軽に情報を得られるだけでなく、ネットを介したコミュニケーションも一般的となった。それと同時に顕在化しているのが、他者に対する辛らつな意見だ。ネットニュース...
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
同じ名前(重複)かつ 日本 ア...
-
if関数の複数条件について
-
excel
-
表計算ソフトでの様式の呼称
-
【マクロ】数式を入力したい。...
-
【Officer360?Officer365?の...
-
エクセルでフィルターした値を...
-
【関数】3つのセルの中で最新...
-
LibreOffice Clalc(またはエク...
-
【関数】=EXACT(a1,b1) a1とb1...
-
Dir関数のDo Whileステートメン...
-
5単位で繰り上げしたい
-
セルにぴったし写真を挿入
-
オートフィルターの絞込みをし...
-
エクセルシートの見出しの文字...
-
エクセルの複雑なシフト表から...
-
エクセルに写真が貼れない(フ...
-
エクセルのライセンスが分かり...
-
【マクロ】excelファイルを開く...
-
【マクロ】【画像あり】4つの...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
PDFとは??
-
原稿用紙の内容をコピーしたい
-
PDF をワードやエクセルに変換...
-
OCRソフトについて
-
pngをtxtへ変換の仕方
-
スキャンしたPDFをエクセルに変...
-
紙ベースの文章をワードにする
-
スキャナで読み込んだ文書をワ...
-
紙に書いてある文字をスキャン...
-
文章のスキャン(JPG)をエクセル...
-
Win10での文字認識に関する質問
-
NET Broadcast Event Window
-
win10 見えないフォルダーを可...
-
同じフォルダ内の画像を連続し...
-
PDFの切り取り
-
2ページのワード文書を1ページ...
-
質問は2つです。 Sma4winという...
-
スタートアップにSBSVというの...
-
変更前のコンピュータ名を調べ...
-
ドキュワークスのようなソフト...
おすすめ情報