「お昼の放送」の思い出

初めまして
漠然とした質問で恐縮なのです。

今、弊社の会社では、過去に作成した文献や技術資料が紙媒体で保管
されており、それを電子媒体で保管してはとの話が出ております。
PDFにして保存するのが一番との事で、その方向で進みそうなのですが
、一つ問題があり電子特許庁のHPみたいに、キーワード検索ができないか
との話が浮上したのです。何百もの資料を有効に活用するには検索機能
が必要不可欠との事 ただ、趣旨は理解できるが各論部分で具体的に
どうすればいいか?????

 データベースソフトとして有名なACCESSなどで、そんな事ができるので
しょうか?
 もしくは、別の専用のプログラムを業者にお願いしないといけない
ものなのか?
 何かそれ専用のソフトなるものが市販で提供されているのか?

 少しACCESSをさわった小生としては、ACCESSでキーワード検索して
ヒットしたら、その文献が開くというのは難解にか思えなく

 どなだか、お詳しい方いらっしゃいましたらご意見、希望致します。

A 回答 (3件)

このような仕組みを「全文検索」と呼びます。


(#2さんの回答のとおりです)

>PDFにして保存するのが一番との事で、その方向で進みそうなのですが

最初の前提として、これは、OCRを使って文字列となっているものですよね?単純に画像をPDFにしたものだと、文字列としての情報にはなりませんから、全文検索以前の問題になります。

以下は、業者に頼むなりして、紙媒体を(画像ではなく)文字列変換したPDFが存在する、と言う前提です。

で、ご質問の解ですが、正直申し上げて、Accessで全文検索システムと言うのはあまり聞いた事がありません。
と言うのは、文書が膨大になればなるほど、全文検索用の言葉(トークン)はその何10倍、何100倍も膨大となり、Accessで管理できるリソースの上限を超える場合が多いからです。
(1つのPDFファイルが何MBで、それが何個あるかによりますが)

データベースシステムの観点で見た場合、全文検索のオプションは、
・Microsoft SQL Server の FullText Search Engine
・Oracle の Oracle Text
などがあります。
記憶の限りでは、Accessに全文検索オプションはありません。

私は Oracle Text しか使った事がありませんが、PDFファイルの内容を解析して全文検索のトークンを作成し、非常に高速に検索する事が可能です。
登録についても、PDFにさえなっていれば、OCRを使う事もなく、バッチでバシバシ登録し、自動的にトークンに区切って検索語テーブルを作成してくれます。
(テキスト、Excel、Word、パワポでも可)

ただ、さすがにここまで来ると「ちょっとオラクル知ってます」程度のSOHO技術者に頼む、と言うわけには行かず、それなりの会社を探し出して、設定と作り込みで(相当な最安値でも)数100万は行ってしまいますね。
    • good
    • 0
この回答へのお礼

早速のご回答ありがとう御座います。また詳しいご説明に感謝致します。
やはり高額な仕組みになってしまうのですね。全文検索ですか、
思い描いているイメージより相当ハードルが高そうです。
非常に参考になりました。

お礼日時:2009/05/08 08:05

ACCESSなどでできますが


>キーワード検索ができないか
と云うことになると、これの登録が(多分)目茶苦茶大変です。文献や技術資料の内容を理解して、適切なキーワードを充分に付けるのは、アルバイトはもちろん、外注でも難しく、それぞれの部門の担当者レベルでないと無理でしょう。一方、多数でキーワードを登録すると、レベルにむらがでたり。
PDFではなく、OCRなどでテキスト化されていればNamazu(ナマズ)のような日本語全文検索システムを使用できるのですが
http://www10.plala.or.jp/miyazawa/namazu/
    • good
    • 0
この回答へのお礼

早速のご回答ありがとう御座います。
やはりaccessでは難しいですね。参考のHPを拝見させて頂きます。

お礼日時:2009/05/08 08:01

> データベースソフトとして有名なACCESSなどで、そんな事ができるので


しょうか?

WebでAccess、文書管理といったようなキーワードを元に
検索しても、サンプルとなるものは見つかると思いますが、可能です。

> もしくは、別の専用のプログラムを業者にお願いしないといけない
ものなのか?

閲覧やダウンロードなどの権限管理などをどうするか?など
凝った造りにする場合は業者でなくても良いので、
プログラムなどを作ったことのある専門家に頼るほうがいいです。

ただ、電子管理するだけならば
http://homepage1.nifty.com/mystaff/DownLoad/webl …
ったようなWeb画面から検索できるようなCGIなら、
ブラウザが使用できるので、インストールもPCごとに不要で便利かと思います。

この回答への補足

早速のご回答ありがとうございます。
参考にさせて頂きます。

補足日時:2009/05/08 07:55
    • good
    • 0
この回答へのお礼

失礼しました。御礼を登録する欄を間違えてしまいました。

お礼日時:2009/05/08 07:58

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

関連するカテゴリからQ&Aを探す


おすすめ情報