![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?e8efa67)
サークルのメンバーで使用するよていのデータベースについて悩んでいます。ご存知の方がいらっしゃいましたら教えてください。データベースの検索システムは、Namazuを使用することになると思います。
検索させたい内容ですが、対象は、PDFファイルです。このPDFにもいくつかパターンがあります。
1)メールのメッセージをテキスト形式のPDFにしたもの
2)広報誌などの切り抜きを自分たちで利用するためにスキャンしてPDFにしたもの
3)IllustratorやWordなどであらかじめPDF書き出しして用意したもの
4)紙文書をスキャンしてPDFにしたもの・・・などなど
これらのそれぞれのPDFファイルにタイトルをつけ、このタイトルを用いて検索したいのです。
そこでお聞きしたいのですが、
1)Namazuを使って実際にこういう検索ができるのかどうか
2)無理であるならば、どのような仕組みを使わなければならないのか
3)用意するPDFには検索させるためにどのような加工が必要なのか・・・(たとえば、PDFと一緒にテキストのデータがいるとかどうとか)
4)こういうことをやっている業者さんがあるのかどうか・・
かなり無理を言いますが、ご存知の方がいらっしゃいましたら教えてください。よろしくお願いいたします。
No.1ベストアンサー
- 回答日時:
以下のツールを使えば、PDFの検索システムは簡単に作れます。
テキスト・html・word・excel・pdfの検索ができます。
Apache (Webサーバ)
perl
namazu
kakasi
xpdf-japanese
googleで上記のキーで検索してみてください。構築方法を解説したページが
たくさんヒットします。
OSはWindows/Linux どちらでもOKです。
自宅サーバ(Linux)と、ノートPC(Windows2000)で、検索システムを動かしてますが
とても便利です。
それから、namazuでわからんときは、メーリングリストで質問するのがお勧めです。
http://www.namazu.org/ml.html
こういうシステムを組むなら、自前でサーバを持つのが一番ベストでしょう。
レンタルサーバでは、ツールのインストールもできない場合もありますので。
外部に公開しないのなら、余っているPCで検索システムを組んでLANにつなぐだけですね。
No.3
- 回答日時:
Namazu は、未体験ですが、pdfファイル化は経験者です。
2)広報誌などの切り抜きを自分たちで利用するためにスキャンしてPDFにしたもの
4)紙文書をスキャンしてPDFにしたもの
上記2つには、OCRが付いていますか?
付いていなければ、Namazu に登録する前に、OCRを行い、透明テキストをpdfに付けておきましょう。
全文検索が可能になります。
ありがとうございます。透明テキストというのがいまいちよくわからないところであったりしますが、少し調べてみます!参考になりました!ありがとうございました!!
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- WordPress(ワードプレス) WordPressのサイトにPDFをアップロードした際にGoogleなどの検索結果に出ないでほしい 1 2022/08/03 10:44
- PDF PDFに精通した方に質問。JPEGファイル群を一つのPDFファイルにするときの容量変化について 6 2023/07/23 19:06
- PDF いきなりPDFで文書の切り取り 3 2022/10/29 13:25
- Excel(エクセル) エクセルを余白なしでPDF化したい 6 2022/08/11 01:14
- iPhone(アイフォーン) 仕事でPDFファイルをダウンロード、閲覧するのにiBooksを使っていますが、ライブラリに凄い数のフ 2 2022/11/16 07:08
- Excel(エクセル) フォルダ内のワードファイルをPDFに一括変換するVBA 3 2023/06/09 16:51
- PDF PDFの回転と保存 3 2023/01/16 15:02
- PDF ワードで作った文書のPDF化 5 2023/04/10 16:56
- Visual Basic(VBA) エクセルのマクロについて教えてください。 3 2023/07/01 12:54
- ホームページ作成・プログラミング パスワードつきホームページ トップページ以下はどうなる 6 2022/08/16 12:04
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
DAOとADOの違いについて
-
SQLite3の許容される登録数は?
-
初心者です。Accessを使って、...
-
SQL Serverとは?
-
Namazuで検索できるシステムに...
-
型 varchar から型 numeric へ...
-
DB2で複数DBからSELECT等
-
データベースの最適化をマクロ...
-
AndroidからのAccessデータベー...
-
バッファプールって?
-
スタライズとは、どういう意味...
-
エクセルの重複データの曖昧検索
-
EXCELの最大データ数
-
SQLの文、節、句について
-
Oracleで今接続しているセッシ...
-
oo4oの読み方・・・・。
-
キャッシュとバッファの違いは?
-
ACCESS2019でのエラーメッセージ
-
Developer2000って何?(^^;
-
Accessのレポートで「縦書き」...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
初心者です。Accessを使って、...
-
ACCESSとFilemakerの違い?
-
SQLite3の許容される登録数は?
-
DAOとADOの違いについて
-
コールドフュージョンって何で...
-
フェイスブックのようなSNSを作...
-
次のようなデータベースをアウ...
-
ホームページの価格の安い順、...
-
オラクルのバージョンとウィン...
-
サーバーを使用したデータベー...
-
求む!オブジェクト指向データ...
-
SQL Serverとは?
-
たまった「pdfファイル」の中か...
-
ファイルメーカーProのバージョ...
-
Webデータベースを作る際に最適...
-
FileMakerとAccess
-
ACCESSでLAN接続のPCからの検索...
-
PostgreSQL vs Oracleどちら...
-
業務用サーバーについて
-
MSはAccessに本気じゃない?
おすすめ情報