自分のホームページにリンクしているホームページのみを全文検索したいのですが、方法はあるでしょうか。
numazuだとサーバー内だけと聞いていますし、一般の検索エンジンを使うとリンクしていないホームページまで検索してしまうので、目的に合いません。
本格的なデータベースを構築すると費用がかかるので、簡易なデータベースあるいはフリーのソフトで行う方法があれば教えて下さい。
検索したいリンク先の件数は、約1000件を予定しています。

A 回答 (2件)

『httpdown』 と 『全文検索』 を組み合わせることで可能ではありますが、多分、1000件という数字は現実的ではないですね。



少なくとも、あらかじめ、検索インデックスを作成していない状態で1000サイトものサーバ外サイトを検索したら、検索ボタンを押したら制御は当面かえってこず、検索エンジンとして成立しないでしょう。

やはりnamazuなどインデックス生成型全文検索システムを改造して、「その1000件のサイト」を対象とする「WWW収集型ロボット」を作るしかないと思います。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
やはりCGIプログラムを組まなければ難しいのでしょうか。
検討させていただきます。

お礼日時:2001/04/04 13:38

自分でソフトを組む方法ではなく、一般の検索サイトの話です。



Google の「検索オプション」では、URLに関連しているページに
絞って検索をすることができます。

参考URL:http://www.google.com/intl/ja/
    • good
    • 0
この回答へのお礼

ありがとうございます。
早速試してみます。

お礼日時:2001/04/04 14:49

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード


このカテゴリの人気Q&Aランキング

おすすめ情報

カテゴリ