アプリでもっと教えて！goo

アプリ版：「スタンプのみでお礼する」機能のリリースについて

PDFそのものから、テキストの抽出

締切済

質問者：mighty5
質問日時：2004/11/14 05:35
回答数：3件

PDFそのものから、テキストの抽出は可能ですか？
Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。
ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか？
逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか？

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

最新から表示
回答順に表示

No.3

回答者： Paulown
回答日時：2004/12/06 14:06

PDFファイルの内部には確かにテキスト情報を持っています。

そこから、テキスト抽出するソフトウェアは存在します。ただ、業務用の非常に高価なソフトが多いです。

Linux環境ですと、xpdfについてくるpdftotextというプログラムを使ってPDFからテキスト抽出できます。

Windows環境ですと、現実的にはAcrobat を使うことになると思います。

PDFの構造は公開されていますので、ご自分でテキスト抽出プログラムを作ることも不可能ではありません。

参考URL：http://partners.adobe.com/public/developer/pdf/i …

- 0
- 件

No.2

回答者： kanachan0099
回答日時：2004/11/14 10:53

>PDFそのものから、テキストの抽出は可能ですか？

http://www.geocities.co.jp/SiliconValley-Bay/199 …
を参照してみてください。

参考URL：http://www.geocities.co.jp/SiliconValley-Bay/199 …

- 0
- 件

No.1

回答者： kotaechan
回答日時：2004/11/14 06:32

　Acrobat 6以前ので作られたものでも、Acrobat 6で読み込めば、テキスト抽出できます。

- 0
- 件

この回答へのお礼

回答どうもありがとうございます！

ということは、Acrobat 6以前ので作られたものは、
Acrobat 6で読み込まない限り、PDFそのものからテキスト抽出は無理ということでしょうか？
何か参考になるURLがあれば教えてくださると、助かります。
よろしくお願いします。

お礼日時：2004/11/14 06:45

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう！

質問する（無料）

似たような質問が見つかりました

PDF WindowsでPDFの書き込みができるソフトを探しています 2 2023/05/01 11:25
PDF PDFの出力時のファイル名を消したい 3 2022/09/05 01:16
その他（プログラミング・Web制作） python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
Word（ワード） wordで画像＆文書作成→pdf→pngに変換するにはどうすれば良いですか？有料ソフトを使いません。 3 2022/08/07 09:25
PDF いきなりPDFで文書の切り取り 3 2022/10/29 13:25
PDF PDFのテキストを追加機能 1 2022/06/18 12:45
PDF AutoCAD図面をPDF fileに変換した際、画像情報やブロック名はわかるのでしょうか。 1 2022/06/03 09:42
Photoshop（フォトショップ） Photoshop に代わるソフトはありますか？ 5 2023/01/26 13:24
PDF こんなPDF作れますか？ 6 2022/05/13 11:14
PDF OCR処理したPDFの結合 1 2023/07/13 18:22

関連するカテゴリからQ&Aを探す

ページトップ

おすすめ情報

質問する（無料）

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

おすすめ情報