別サイトのHTML内にある情報を自動取得して、自分のサイトに組込む方法を教えてください。
例えば、Yahooの新着情報部分だけを自動的に収集・抽出して、自分のサイト内にYahooの新着情報を表示させるようなイメージです。
インラインフレーム以外の方法で、自動取得して表示したいです。
データーベース をHTML化したものが別サーバにあるので、一部分だけ抽出し、イントラサイト内に新着情報としてシンプルな表示に加工して埋め込みたいのです。
ネットで調べたけどいまいち分からず…
方法の名称や、具体的な方法を教えてください。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
クロールとかスクレイピングとか呼ばれています
ボットと呼ばれるプログラムが定期的に HTTP 通信を行い、HTML を取得して解析して必要な情報を取り出して蓄積する技法です
参考) 有名な実例
https://developers.google.com/search/docs/crawli …
ただしこれを業務として運用する際は、
他者から攻撃と見なされ訴訟問題に発展したり、
著作権侵害行為と判断され賠償請求されたりと、
技術的にも法務的にも危険がつきまとうので多大なる配慮が必要になります
参考) 技術的
https://ja.wikipedia.org/wiki/%E5%B2%A1%E5%B4%8E …
参考) 法務的
https://about.yahoo.co.jp/common/terms/chapter1/
Yahoo! JAPAN 利用規約
第1章 総則 7. 当社のサービスなどの再利用の禁止
お客様が、当社のサービスやそれらを構成するデータを、当該サービスの提供目的を超えて利用した場合、当社は、それらの行為を差し止める権利ならびにそれらの行為によってお客様が得た利益相当額を請求する権利を有します。
参考) 明確に禁止しているサイト
https://support.yahoo-net.jp/PccFinance/s/articl …
ありがとうございます!
スクレイピングというのですね!
自社イントラ内なので著作権は大丈夫ですが、高負荷がかからないように注意する必要がありそうですね…。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- WordPress(ワードプレス) WordpressでYouTubeの埋め込みができない。 1 2022/10/26 01:08
- Excel(エクセル) VBA : スクレイピングできない 4 2023/05/12 22:26
- ネットワーク cutestat.comというサイトでipアドレスが確認できる件 1 2022/04/10 14:19
- インターネットビジネス ネット上での論文の紹介について SNSや情報サイトなどで、例えば 「ハーバード大学の研究から分かった 1 2023/08/22 23:21
- 政治 自民党はこういうことをやっているのに、なぜ野党はやらないのか? 4 2023/04/25 19:54
- 借金・自己破産・債務整理 破産者マップの個人情報について。 親族が飲食店を一等地で営んでおりましたが… コロナで大打撃を受けて 4 2022/11/01 20:52
- Google Drive Google form を利用して 問い合わせフォームを作りたい 1 2022/04/25 14:15
- その他(開発・運用・管理) Windowsバッチファイルでリモートデスクトップを自動ログインするが確認画面が出る対処方法 1 2022/12/19 15:48
- その他(開発・運用・管理) おんどとりWebStorage APIから温度情報を取得し表示したい 2 2023/08/03 09:53
- その他(買い物・ショッピング) Amazonプライム会員&Yahoo!プレミアム会員に誘導する為の巧妙な仕掛け 1 2023/06/22 06:20
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
「取得先」という表現について
-
Yahoo! JAPAN IDを新規取得でき...
-
アクセスの度にIPアドレスを変...
-
【VBA】EXCELブックを開かずに...
-
コンピューター名を取得したい
-
VB or VBScriptでPCの製造番号...
-
Wordでウィンドウハンドル(Hwn...
-
PHP の cURL で、htmlを画像へ...
-
積立投資してます。現在平均取...
-
VBAでPDFファイルの文書のプロ...
-
グローバルIPの取得方法を教え...
-
IEを使わないでhtmlテキストを...
-
プリンタ用紙種類の取得
-
C# ASP.NET でIPアドレスからア...
-
Excel VBA:特定の文字列以降(...
-
個人向けルーターを使用してもS...
-
VBAでできますか?
-
アクセスしてきたPCのFQDNがと...
-
VBS「開いているページ」のURL...
-
VB2005でXMLデータから複数ある...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
「取得先」という表現について
-
IEを使わないでhtmlテキストを...
-
Yahoo! JAPAN IDを新規取得でき...
-
不正競争防止法に該当するので...
-
ps3で久しぶりにCDの音楽情報取...
-
format関数について
-
【VBA】EXCELブックを開かずに...
-
自動車教習所について 質問 普...
-
Excel VBA:特定の文字列以降(...
-
VBAでPDFファイルの文書のプロ...
-
【C#】FindWindowExの使い方を...
-
ミュージックのアートワークを...
-
アクセスの度にIPアドレスを変...
-
ローカルのコンピュータ名を取...
-
各クライアントマシンのログイ...
-
IPアドレスとMACアドレスを取得...
-
積立投資してます。現在平均取...
-
VB or VBScriptでPCの製造番号...
-
VBS「開いているページ」のURL...
-
EXCEL、マクロ-改ページ行番号...
おすすめ情報