PDFファイルをエクセルにしたくて、こちらにお尋ねしました。
いつもはよくPDFファイルになっている表をワードにコンバートする、ということはよくやっているのですが、おなじPDFといっても、テキストの編集可能なものと、まったく触れないもの(画像)のものと二種ありますよね?今回はその後者のほうのお尋ねです。
PDFの表があるのですが、スキャナで読み取り、画像としてPDFになったものがあります。
それを編集したいので、エクセルにテキストとして落としたいのですが、そういったことは可能でしょうか?おおよそ思いつくもの(ネット検索で調べてみた)をあたってはみたのですが、
その検索先の説明が難しかったり、やってみてもやはりこのファイルは無理だったり、、で、うまくいきませんでした。
また、手持ちのものにエプソンのスキャナがあり、OCR(だったかな?)の機能があり、それで読み取ってみたりもしたのですが、うまく読み取らない&改行などが狂いすぎて表を維持しておらず、とても使えませんでした。
お金のかからないもので、こういう方法がある、というのがあればぜひ教えていただけないでしょうか。
No.2ベストアンサー
- 回答日時:
PDFはテキスト情報も併せ持つものと、画像的なものだけのものが会えいます。
後者と判明したようだから、途はOCRソフトで、テキスト化(さらに欲を言えばエクセルファイルに、さらに罫線つきとか)を目指すほか無いわけです。
そのOCRソフトは実は技術的には難しい(こうしたら正確に文字を決められる、という方法は無いようで、色んな方法を組み合わせるようです(語句辞書を併用とか。特に手書き文字は難しい。)だから高性能のものは高価だと思います。
(ちなみに1980年代はコンピュターも専用機が必要で、数千万円もした。)
プリンタに付属するOCRソフト辺りが、一番安価でしょう。個人でOCRプログラムを造るのは難しそうなので、フリーソフトではそこそこのものしか無いのではないかな。やろうとしていることが高等な技術なので、お金のかからない、といっても一般には無理だ。
ーー
もうひとつ、スキャナで取り込んだ瞬間のメモリの画像ファイルと、既にPDF化してパソコンディスク二「保存してある画像ファイルは、コンピュタ的には同じ部類のものなのだが、パソコンのPDFファイルをOCRソフトに読ませることが出来るかどうかはソフトのつくり具合によるが、出来ないかもしれない。
よく調べてください。出来ない場合は1枚ずつOCRで画像ファイルを取り直しにだるかもしれない。
PDFをOCRに架けられる単位というものが、ソフトで決っているものです。
ーーー
Googleで「VECTOR OCR フリー」などで照会してみてみてください。
http://freesoft.livedoor.biz/
>フリーソフトベクターの全体でOCRのソフトを探すと、45のソフトウェアが検索にヒットします。
名刺読み取り専用(項目が決っていて、活字印刷物が多い)などの物が含まれているかも。
ありがとうございます。今回は、読み取りのOCRを入手したのですが、改行されてしまい(変なふうに)うまくいきませんでした。
またの機会に試してみます。ありがとうございました。
No.3
- 回答日時:
>エプソンのスキャナがあり、OCR(だったかな?)の機能
たぶん、『読んde!ココ』が入っていると思いますが、これに敵うものはないと思うのです。
もし違うソフトでしたら、無視して結構です。
『読んde!ココ』は、表に対して、使いこなしが、イマイチなってしまったようですね。たぶん、慣れの問題なんだろうと思います。昔は、もっと上手く出来たような気がしますが……。
画像対象を「表」として選んで、OCRの青い線ではなく、赤い線とセルの枠線を上手く合わせられればよいのですが、それが、青い線だけで区分けされていると思うと、そこが抜けてしまうのですね。それで、上手く切り分けできないのですが、丁寧に、頑張ってするしかないと思います。何度もやりなおして、イラッとするのは分かるけれども、残念ですが、私の知る限り、他に勝るものがないと思います。フリーソフトなどとは比較にならないと思います。
もし、『読んde!ココ』を持っていなかったら、試用版が出ていますし、それはフル機能で、数週間か使えます。
努力しかないみたいなことしか言えなくてすみません。他のOCRもあるけれど、私は、『読んde!ココ』が一番だったのです。
ありがとうございます。たまたまそれを入手したのですが、やはり改行などの誤りがひどくて、結局は使えませんでした。
それさえなければ読み取り自体はうまくいったのですが、、どうもありがとうございました!
No.1
- 回答日時:
スキャナで読み取り、画像になったものは、画像のままですので、文字としては取り込めません。
文字情報はありません。OCRなどで取り込めば文字になっているので、取り込めます。お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- Word(ワード) テキストデータのPDFをWordで開くとテキストが図として認識されてしまう 3 2023/01/24 11:38
- PDF ワードで作った文書のPDF化 5 2023/04/10 16:56
- WordPress(ワードプレス) WordPressのサイトにPDFをアップロードした際にGoogleなどの検索結果に出ないでほしい 1 2022/08/03 10:44
- その他(プログラミング・Web制作) 【GAS】Gmail本文をブラウザ表示された状態でPDFにしたいです 1 2022/12/12 09:54
- PDF PDF作成ファイルの不具合の件 5 2022/08/15 15:00
- PDF いきなりPDFで文書の切り取り 3 2022/10/29 13:25
- Visual Basic(VBA) エクセルのマクロについて教えてください マクロを実行して 作業フォルダの中にある PDFファイル名を 3 2023/07/01 15:16
- PDF PDFに精通した方に質問。JPEGファイル群を一つのPDFファイルにするときの容量変化について 6 2023/07/23 19:06
- PDF PDFで資料を編集したいです 2 2023/08/10 22:56
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
普通のスキャナでネガフィルム...
-
OCR
-
スキャナーで読取ったフォーム...
-
エクセルVBAで画像から文字を抽...
-
PDFからエクセルへの変換につい...
-
OCRソフトを使って原稿用紙...
-
パソコンにプリンターからスキ...
-
アドレス記号の読み方を教えて!!
-
グラボのドライバーが互換性が...
-
windows11でクイックスキャン等...
-
スキャナーで取り込むといつも...
-
カラーコピーとカラープリント...
-
abmファイルを開くまたは変換す...
-
Nvidiaドライバーの正しいアン...
-
プリンターでスキャンした書類...
-
両面印刷された書類をスキャナ...
-
コピーと原本の見分け方
-
新聞記事のスキャンイングを美しく
-
コピー機でスキャンができません
-
スキャナーの設定をする時にSMB...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
エクセルVBAで画像から文字を抽...
-
スキャナーからJPEGで取り込み...
-
普通のスキャナでネガフィルム...
-
スキャナーで読取ったフォーム...
-
PDFファイルの作り方を教えてく...
-
楽譜をスキャンしてXMLファイル...
-
紙の書類をパソコンに入れたい
-
OCRソフトを使って原稿用紙...
-
Canonスキャナが使えないので困...
-
スキャナで読み取って翻訳する方法
-
OCR
-
A4プリントをパソコンに取り込...
-
手書き文字・図形をPDF化
-
Macで自炊したpdf書籍のオスス...
-
PDFからエクセルへの変換につい...
-
スキャナで取り込んだPDFファイ...
-
スキャナで取り込んだ画像の劣化
-
ノートンインターネットセキュ...
-
Canonのスキャナ使用際に困って...
-
鷲の絵をGIFで作製したい!
おすすめ情報