『ボヘミアン・ラプソディ』はなぜ人々を魅了したのか >>

PDFそのものから、テキストの抽出は可能ですか?
Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。
ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか?
逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

このQ&Aに関連する最新のQ&A

A 回答 (3件)

PDFファイルの内部には確かにテキスト情報を持っています。

そこから、テキスト抽出するソフトウェアは存在します。ただ、業務用の非常に高価なソフトが多いです。

Linux環境ですと、xpdfについてくるpdftotextというプログラムを使ってPDFからテキスト抽出できます。

Windows環境ですと、現実的にはAcrobat を使うことになると思います。

PDFの構造は公開されていますので、ご自分でテキスト抽出プログラムを作ることも不可能ではありません。

参考URL:http://partners.adobe.com/public/developer/pdf/i …
    • good
    • 0

>PDFそのものから、テキストの抽出は可能ですか?


http://www.geocities.co.jp/SiliconValley-Bay/199 …
を参照してみてください。

参考URL:http://www.geocities.co.jp/SiliconValley-Bay/199 …
    • good
    • 0

 Acrobat 6以前ので作られたものでも、Acrobat 6で読み込めば、テキスト抽出できます。

    • good
    • 0
この回答へのお礼

回答どうもありがとうございます!

ということは、Acrobat 6以前ので作られたものは、
Acrobat 6で読み込まない限り、PDFそのものからテキスト抽出は無理ということでしょうか?
何か参考になるURLがあれば教えてくださると、助かります。
よろしくお願いします。

お礼日時:2004/11/14 06:45

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QVBからPDFファイルの埋め込みテキストを検索する方法

VBで文書を検索できるシステムを作っています。
通常検索では、テキストボックスに入力した文字列と一致するものをデータベースに登録した文書名から探してきてMSHFlexGridコントロール上に表示するようにしています。
今回は、追加検索として、指定したフォルダの中にあるPDFファイルやワードファイルなどの文書中の文字から一致するものを探して表示する機能を作りたいと考えています。
この様な機能はどの様に作れば良いのでしょうか?
色々とサイトを探してみたのですが、該当するものを見つけることが出来ませんでした。
よろしくお願いします。

Aベストアンサー

こんにちは。

[xdoc2txt]
PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

VB から xdoc2txt.exe を起動して抽出テキストをリダイレクトする。
または、ActiveX 版 xdoc2txt.ocx を使うとか。

一から VB でとなると恐ろしく面倒で、難しいですよ。

まず速度面の問題があるでしょうし、ファイルフォーマットの解析が
必要になったり。。

QVBA オブジェクトが空かどうか判定する

皆様のお知恵を拝借させてください。

エクセルVBAでオブジェクトを入れる変数を定義し、その変数にオブジェクト
が入っているかどうか検査したいのですがどうしたらいいでしょうか。

例えば---
Dim a As Workbook
If a <> nothing then ←この部分が分からない。このままだとエラー。
処理
End if
---------
環境
エクセル2003
WinXPsp1

Aベストアンサー

もし、aが空だったら
If a Is Nothing Then 

もし、aが空じゃなかったら
If Not a Is Nothing Then


人気Q&Aランキング