サークルのメンバーで使用するよていのデータベースについて悩んでいます。ご存知の方がいらっしゃいましたら教えてください。データベースの検索システムは、Namazuを使用することになると思います。
検索させたい内容ですが、対象は、PDFファイルです。このPDFにもいくつかパターンがあります。
1)メールのメッセージをテキスト形式のPDFにしたもの
2)広報誌などの切り抜きを自分たちで利用するためにスキャンしてPDFにしたもの
3)IllustratorやWordなどであらかじめPDF書き出しして用意したもの
4)紙文書をスキャンしてPDFにしたもの・・・などなど
これらのそれぞれのPDFファイルにタイトルをつけ、このタイトルを用いて検索したいのです。
そこでお聞きしたいのですが、
1)Namazuを使って実際にこういう検索ができるのかどうか
2)無理であるならば、どのような仕組みを使わなければならないのか
3)用意するPDFには検索させるためにどのような加工が必要なのか・・・(たとえば、PDFと一緒にテキストのデータがいるとかどうとか)
4)こういうことをやっている業者さんがあるのかどうか・・
かなり無理を言いますが、ご存知の方がいらっしゃいましたら教えてください。よろしくお願いいたします。
No.1ベストアンサー
- 回答日時:
以下のツールを使えば、PDFの検索システムは簡単に作れます。
テキスト・html・word・excel・pdfの検索ができます。
Apache (Webサーバ)
perl
namazu
kakasi
xpdf-japanese
googleで上記のキーで検索してみてください。構築方法を解説したページが
たくさんヒットします。
OSはWindows/Linux どちらでもOKです。
自宅サーバ(Linux)と、ノートPC(Windows2000)で、検索システムを動かしてますが
とても便利です。
それから、namazuでわからんときは、メーリングリストで質問するのがお勧めです。
http://www.namazu.org/ml.html
こういうシステムを組むなら、自前でサーバを持つのが一番ベストでしょう。
レンタルサーバでは、ツールのインストールもできない場合もありますので。
外部に公開しないのなら、余っているPCで検索システムを組んでLANにつなぐだけですね。
No.3
- 回答日時:
Namazu は、未体験ですが、pdfファイル化は経験者です。
2)広報誌などの切り抜きを自分たちで利用するためにスキャンしてPDFにしたもの
4)紙文書をスキャンしてPDFにしたもの
上記2つには、OCRが付いていますか?
付いていなければ、Namazu に登録する前に、OCRを行い、透明テキストをpdfに付けておきましょう。
全文検索が可能になります。
ありがとうございます。透明テキストというのがいまいちよくわからないところであったりしますが、少し調べてみます!参考になりました!ありがとうございました!!
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
SQLite3の許容される登録数は?
-
型 varchar から型 numeric へ...
-
AndroidからのAccessデータベー...
-
エクセルのフォームについて(...
-
データベースの最適化をマクロ...
-
スタライズとは、どういう意味...
-
DBとテキストファイルの比較
-
【パフォーマンス】ファイル読...
-
ODBC接続とDBLINK
-
DB2 UDBって?
-
データベースの2GBって・・・?
-
oracleでいう「SID」名って??
-
VBAかSQL?
-
OUTLOOKへのデータインポート
-
クエリをキャンセルしたいので...
-
NOTESでデータベースを開いたと...
-
ACCESSで条件付き書式の設定方法
-
Access管理とExcel管理
-
VPNでの接続速度が異なります。
-
AS400へAccessから接続す...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
初心者です。Accessを使って、...
-
SQLite3の許容される登録数は?
-
データベースの選び方
-
家庭内LAN内のWindowsとMac OS ...
-
社内ネットワークとデータベー...
-
SQL Serverとは?
-
サーバーを使用したデータベー...
-
ERD SCMとは?
-
ファイルメーカーとアクセス
-
ACCESSとFilemakerの違い?
-
データベースへ携帯でアクセス
-
MSはAccessに本気じゃない?
-
FileMakerとAccess
-
検索システムをwebにつくり、更...
-
「アクセス+SQLサーバー」より...
-
DAOとADOの違いについて
-
たまった「pdfファイル」の中か...
-
フェイスブックのようなSNSを作...
-
型 varchar から型 numeric へ...
-
データベースの最適化をマクロ...
おすすめ情報