dポイントプレゼントキャンペーン実施中!

早速質問させてください。

文字、写真が記載されている書籍をPDFにしました。
そのPDFには書籍のテキストデータが入ってしまいました。
(OCRというのかな?PDFの文字をコピぺでテキスト貼付けが出来るようになっている)

このPDFからテキストデータを抜く方法はないでしょうか。
ちなみに書籍は既に手元にございません。

50ページ~150ページくらいのPDFファイルが
60ファイルくらいあるので、
なるべく簡単な方法をご教授いただきたく存じます。

宜しくお願いいたします。

A 回答 (3件)

こんにちは



Acrobat(有償)の場合は、文書の検査から非表示テキストを削除すること
が可能です。但しAcrobatXではメニューが違うので留意。
今Acrobatが無くても体験版なら使えるかもしりませんね。
http://www.adobe.com/go/tryacrobatpro_jp/

画像で書き出して、再度PDFを作成はいかにも面倒と思います。

PDF作成ソフトをお持ちでしたら、Adobe Readerの印刷の詳細設定から
「画像として印刷」にして作り直す方法も考えられます。


参考フリーのPDF作成ソフト例CubePDF
http://www.forest.impress.co.jp/lib/offc/documen …
    • good
    • 0

写真だけにしたいということでしたら


Acrobatの文書処理メニューに
「すべての画像を書き出す」
というのがあります。
    • good
    • 0
この回答へのお礼

ご解答ありがとうございます。

Acrobatを持っておりません。

Acrobat以外で透明テキストを削除できないでしょうか。

お礼日時:2012/08/25 13:08

スキャンした文書でPDFにテキストデータがあるものは


一般に透明テキストと呼ばれています。

>このPDFからテキストデータを抜く方法はないでしょうか。


「抜く」というのがタイトルどおり外すということで
削除という意味であれば、
お使いのソフト次第ですが、全体を画像として保存というのが適当かと思います。

そんな選択肢が無く、単に「テキストデータをコピーされたくない」ということであれば
セキュリティを変更してテキストをコピー禁止にすれば良いと思います。

まあ、いずれにしても全ファイル一括処理は難しいのではないでしょうか?

次回から電子化する際にはOCR処理を停止しておくということですね。
    • good
    • 0
この回答へのお礼

早速のご解答ありがとうございます。

OCRの精度が悪く、
透明テキストが実際とは違う文字になっている箇所があるため、
削除したいのですが。。。

>お使いのソフト次第ですが、全体を画像として保存というのが適当かと思います。

当方アクロバットリーダーのみしかもっておりません。

上記の画像として保存が出来るソフトを教えていただけますでしょうか。

お礼日時:2012/08/25 13:12

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!