特定のWEB上の情報を収集して、自動的にDBに保存する方法を教えてください。
たとえば(あくまで例えばですが)、株価情報を株価情報のサイトから取得して、その情報を自前のサーバーのデータベースにいれる、というようなことをしたい考えているとします。
cronを使えば、定期的に何かを実行させることができる、というところまではわかったのですが、それ以上のことがわかりません。
おそらく、株価の情報サイトからHTMLのデータをひろってきて、そこから目的の値を抽出するのでしょうが、
1、どうやって(どのようなプログラム言語を使って)特定のサイトからHTMLのデータをひろってくるのか
2、どうやって(どのようなプログラム言語を使って)HTMLのデータから目的の値を抽出するか
3、どうやって(どのようなプログラム言語を使って)抽出した値をDB(mySQL)に保存するか
この3つが特にわからない(知りたい)のです。
ちなみに今私が知っている言語は、mySQL,PHP,Cくらいです。
また、これを実現しようとしている環境についてですが、OSはUnix系で、レンタルサーバーであるものとします。つまり、データのロードも抽出もDB更新もすべてレンタルサーバー上で行いたいと思っています。
No.2ベストアンサー
- 回答日時:
基本的には、ブラウザを作成する、ということです。
1)ソケットで相手サーバーに接続してhttpリクエストを送る
2)返ってきたレスポンスからHTML記述を解析して欲しい情報を切り出す(スクレイピングという)。
この部分は#1の方の言うとおりモジュールが出回っています。
3)各プログラム言語の方法(MySQLインターフェース)に依存します
スクレイピングの困ったところは、相手先の記述が変わった場合、
当然こちら側のプログラムも手直ししなければいけない、という点です
。
また、正式なブラウズではないので、相手側に迷惑をかけない方法を
考慮するのも大事ですね。
Last-Modifiedを見て、更新されていなかったら処理ストップ、など。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- HTML・CSS 別サイトのHTML内にある情報を自動取得して、自分のサイトに組込む方法を教えてください。 例えば、Y 1 2023/06/15 08:09
- HTML・CSS WEBサイトの構築。表示データとWEBデザインを分離する考え方を専門用語・業界用語では何と言うか? 8 2022/09/27 09:16
- インターネット広告・アフィリエイト アフェリエイトサイト 作成について 5 2022/05/13 21:31
- その他(プログラミング・Web制作) Windowsのマクロプログラムで、こんなことできますか? 3 2022/06/28 14:30
- その他(プログラミング・Web制作) 大学のゼミのレポートがムカつきます。 R言語というデータ分析に特化したプログラム言語を用いた授業の課 1 2023/06/29 00:50
- その他(セキュリティ) 匿名チャットアプリのトラッキングについて。顔写真や個人情報の漏洩はあるのか。 2 2023/03/28 00:00
- その他(データベース) pythonでsqlight勉強中、クエリー結果の利用法教えて下さい 1 2022/04/28 20:38
- ハッキング・フィッシング詐欺 スマホアプリのトラッキング 個人情報について 5 2023/03/31 08:16
- その他(セキュリティ) 匿名チャットアプリでの知られたくない会話 個人情報について 1 2023/03/29 18:08
- その他(セキュリティ) 匿名チャットアプリ トラッキング 個人情報について 1 2023/03/29 20:35
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・「みんな教えて! 選手権!!」開催のお知らせ
- ・漫画をレンタルでお得に読める!
- ・「黒歴史」教えて下さい
- ・2024年においていきたいもの
- ・我が家のお雑煮スタイル、教えて下さい
- ・店員も客も斜め上を行くデパートの福袋
- ・食べられるかと思ったけど…ダメでした
- ・【大喜利】【投稿~12/28】こんなおせち料理は嫌だ
- ・前回の年越しの瞬間、何してた?
- ・【お題】マッチョ習字
- ・モテ期を経験した方いらっしゃいますか?
- ・一番最初にネットにつないだのはいつ?
- ・好きな人を振り向かせるためにしたこと
- ・【選手権お題その2】この漫画の2コマ目を考えてください
- ・2024年に成し遂げたこと
- ・3分あったら何をしますか?
- ・何歳が一番楽しかった?
- ・治せない「クセ」を教えてください
- ・【大喜利】【投稿~12/17】 ありそうだけど絶対に無いことわざ
- ・【選手権お題その1】これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
- ・集合写真、どこに映る?
- ・自分の通っていた小学校のあるある
- ・フォントについて教えてください!
- ・これが怖いの自分だけ?というものありますか?
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・10代と話して驚いたこと
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
C言語、C+、C++、C#の違い
-
プログラムに書かれる"%"記号の...
-
プログラムからアイコンファイ...
-
C言語とhtmlの違いを どな...
-
VB.net Excelグラフの色
-
VBSでDim、Private、Publicの違い
-
現在、大学の応用化学科に所属...
-
COBOLでのNOT = の AND条件
-
TO_CHARで小数点以下がある場合...
-
Excel VBAで文字化けする (英語...
-
ホワイトハッカーを目指そうか...
-
PICのピンの割り当て、この記述...
-
C++における継続行
-
パスカルケースの由来。
-
HTMLとC++で、どんなホームペー...
-
"グラフィック言語"とは何ですか?
-
おみくじを作りたいのですが
-
UNITY Float型の接尾辞fって
-
webbrowserでクリックさせない...
-
VBSとWSHは読み方が違うだけで...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
C言語、C+、C++、C#の違い
-
COBOLでのNOT = の AND条件
-
プログラムに書かれる"%"記号の...
-
C言語とhtmlの違いを どな...
-
プログラムからアイコンファイ...
-
vbaとc言語の関連性について
-
UNITY Float型の接尾辞fって
-
COBOLで文字タイプを数字...
-
Excel VBAで文字化けする (英語...
-
TO_CHARで小数点以下がある場合...
-
VBSでDim、Private、Publicの違い
-
VBScriptで引数を省略したい場合
-
UWSCはどのプログラミング言語?
-
VBSとWSHは読み方が違うだけで...
-
C++における継続行
-
プログラムははぜ小文字大文字...
-
パスカルケースの由来。
-
C++ ってなんて読む?
-
C for Linuxでの設定ファイル読...
-
HTMLとC++で、どんなホームペー...
おすすめ情報