VBからPDFファイルの埋め込みテキストを検索する方法

解決済

質問者：higuchi-yu
質問日時：2009/02/01 12:30
回答数：2件

ＶＢで文書を検索できるシステムを作っています。
通常検索では、テキストボックスに入力した文字列と一致するものをデータベースに登録した文書名から探してきてMSHFlexGridコントロール上に表示するようにしています。
今回は、追加検索として、指定したフォルダの中にあるPDFファイルやワードファイルなどの文書中の文字から一致するものを探して表示する機能を作りたいと考えています。
この様な機能はどの様に作れば良いのでしょうか？
色々とサイトを探してみたのですが、該当するものを見つけることが出来ませんでした。
よろしくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： KenKen_SP
回答日時：2009/02/03 10:06

こんにちは。

[xdoc2txt]
PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

VB から xdoc2txt.exe を起動して抽出テキストをリダイレクトする。
または、ActiveX 版 xdoc2txt.ocx を使うとか。

一から VB でとなると恐ろしく面倒で、難しいですよ。

まず速度面の問題があるでしょうし、ファイルフォーマットの解析が
必要になったり。。

- 0
- 件

通報する

No.2

回答者： temtecomai2
回答日時：2009/02/03 12:34

明示的に使ったことはありませんが、Microsoft の各種検索エンジンに検索対象を増やす目的で iFilter という仕組みがあります。

これも調査なさってはどうでしょうか。

<Microsoft のサイトに掲載されている iFilter の一覧>
http://www.microsoft.com/japan/sharepoint/server …

<iFilter を利用して PDF のテキスト検索をするサンプル>
http://gihyo.jp/dev/serial/01/make-findspot/0016