プロが教えるわが家の防犯対策術!

学校の授業でspiderを作成することになり、以前から勉強しようと思っていたRubyを使用して作成することにしたのですが、学校ではjavaをメインに他の授業も進めているので、参考書籍として挙げられた本は全てjavaでした。
RubyでのSpideringやネットワークについて扱っている本・サイトでおすすめのものがありましたらぜひ教えてください。
ちなみに使用するOSはWindowsXPです。

A 回答 (1件)

こんばんは。

なかなか回答がつきませんね。
スパイダー、つまりこうした巡回ソフトは目的が単なるファイル取得か
それとも Web 検索するかによって異なりますが、クローラ(crawler)、
検索ロボット(searchbot)、プリフェッチャ(prefetcher)と
呼ばれたりもするので、検索の際はご参考まで。

Java の参考書籍で記述されているコードはお分かりになりますか。
Java と Ruby の機能は一対一で対応しないので書き換えは
一筋縄ではいかないと思いますが、Ruby では Net::HTTP クラスを
利用することになるでしょう。
http://www.ruby-lang.org/ja/man/?cmd=view;name=N …

私が Ruby について参考にしているサイト(www.ruby-lang.org 以外)を
参考 URL に挙げておきます。
(どちらもネットワーク関連が未完。残念!)

Ruby 言語仕様自体に不慣れならまず「プログラミング Ruby」
(ピアソン・エデュケーション)を買ってください。
http://www.pearsoned.co.jp/washo/prog/wa_pro44-j …
クックブック的なものなら「Ruby レシピブック」がそれに当たります。
http://www.sbcr.jp/books/products/detail.asp?sku …

「Ruby アプリケーションプログラミング」(Ohmsha)は上級編。
http://ssl.ohmsha.co.jp/cgi-bin/menu.cgi?ISBN=4- …

肝心の巡回ソフトに関する参考文献としては「Ruby Magic --
Rubyで極める正規表現」(Ohmsha)がそのものずばりでしょう。
http://ssl.ohmsha.co.jp/cgi-bin/menu.cgi?ISBN=4- …

あとは robots.txt の有無を尊重する、ページを取得する際に
適当にウェイトをかける、ユーザエージェントを偽装することは
原則としてしないなど、相手サイトに対して失礼のないように
心掛けてください。

参考URL:http://www.namaraii.com/rubytips/,http://pleac.s …
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!