インターネットからサイトにアクセスして自動で情報を集めたいと考えています(例えば、yahooファイナンスから株価を集めたり、google scholarなどで論文を集めたり)。
そこで、
クライアント側でhttp接続を行い、
htmlを解析して必要な情報だけを抽出したい、
というときにおすすめの言語はありますでしょうか。
あまり本格的なものを作るわけではないので、できるだけ簡単?に作成できるものを希望します。
特にhttp接続の方法がよくわからないので、そこをお手軽にできるものを教えて頂ければありがたいです。
JavaやJava Scriptで作成を試みたのですが、なかなか進まないので質問に至った次第です。(Java: Jakarta Commonsのhttp cliantを使用したがビルド方法が分からず、Java Script: http接続法が分からず)
よろしくお願いします。
No.1ベストアンサー
- 回答日時:
Rubyですかね。
Mechanizeライブラリを使えば、ログインとか、Basic認証とか、クッキーとかお任せです。
http://www.google.co.jp/search?q=ruby+mechanize+ …
PerlがMechanizeの本家のようですが、現時点でどちらも知らないのであればRubyがわかりやすいのでおすすめです。
No.3
- 回答日時:
サイトのhtmlの取得には外部のwgetを利用して
取得したhtmlの解析にはDOMが扱える言語でやるのが一番楽でしょう。
(もっとも言語の方でhttp接続のAPIがあるならそっちをりようすればいい。なければwgetを利用する)
そうすれば自分でhtmlの構文解析のプログラムを書く必要がない。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
C言語、C+、C++、C#の違い
-
プログラムに書かれる"%"記号の...
-
COBOLでのNOT = の AND条件
-
vbaとc言語の関連性について
-
C言語とhtmlの違いを どな...
-
UNITY Float型の接尾辞fって
-
COBOLで文字タイプを数字...
-
家計簿ソフトの作成
-
VBSでDim、Private、Publicの違い
-
Excel VBAで文字化けする (英語...
-
グローバル変数の初期化のタイ...
-
UWSCはどのプログラミング言語?
-
ゲームは何文字のプログラムで...
-
verilogの勉強ってどうやってし...
-
今プログラミングを始めるなら...
-
今後、プログラマーとして習得...
-
C言語でのWindowsプログラム
-
シグナルと例外の違い
-
素人です。『旧:オークション...
-
C言語とJavaの同時学習
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
今ってプログラミング言語は何...
-
C言語、C+、C++、C#の違い
-
プログラミング言語について
-
COBOLでのNOT = の AND条件
-
近年誕生したプログラミング言語
-
UNITY Float型の接尾辞fって
-
C言語とhtmlの違いを どな...
-
vbaとc言語の関連性について
-
C++における継続行
-
プログラムに書かれる"%"記号の...
-
COBOLで文字タイプを数字...
-
VBSでDim、Private、Publicの違い
-
TO_CHARで小数点以下がある場合...
-
VBSとWSHは読み方が違うだけで...
-
Excel VBAで文字化けする (英語...
-
VCとVC++
-
HTMLとC++で、どんなホームペー...
-
C++ ってなんて読む?
-
UWSCはどのプログラミング言語?
-
会計システムをつくるために必...
おすすめ情報