電子書籍の厳選無料作品が豊富!

個人でスクレイピングをするために、HTMLソースの内容を見ることがあるのですが、ソース内容と表示されているページ内容に明らかに違いがあるときがあります。

例えば、http://lanove.kodansha.co.jp/ にアクセスすると、アクセス直後、ページ表示するのに1秒ほどかかっているようなのです。

表示されたページを「右クリック⇒ページのソースを表示」操作で、ソース確認したところ、「表示されているページ内容と、タグ内容」が全然異なっているのです。(chromeやIEで確認済み)

多分、ページの内容(ソースファイル?)を外部ファイルから読み込んでると思うのですが、「表示されたページ内容のソース」と「読み込み先のURL」を知る方法はないでしょうか?

ご教示お願いいたします。

A 回答 (2件)

恐らくですが、読み込み先のURLはここでしょうか。

URLSnooper2による解析です。

http://cont.lanove.kodansha.co.jp/10004.html
    • good
    • 1
この回答へのお礼

情報ありがとうございます。確か教えていただいたアドレスで間違いなさそうです。大変助かりました。

お礼日時:2015/07/10 15:28

なぜIEやChromeなのでしょう。

通常は開発者向けツール( https://addons.mozilla.jp/firefox/extensions/dev … )の豊富なfirefox使って調べる(^^)。解析ツールも揃っているし、そもそも最もウェブ標準に近い。
>多分、ページの内容(ソースファイル?)を外部ファイルから読み込んでると思うのですが、
 テキストだけのページを除いて、その量の多寡は問わず必ず他のファイルを読み込んでいますよ。
[例]
 hoge.com/page/index.html 内に<img src="../image/logo.gif">とあれば、ブラウザはサーバー(hoge.com)に/image/logo.gifを要求する。

 画像が多いですから、それらをすべてサーバーに要求して揃うまで時間がかかる。あれだけ画像があれば時間はかかるでしょう。
 iframeなどで他のページを読み込んでいないですが、たとえそうだったとしても、関係ないです。

>「表示されているページ内容と、タグ内容」が全然異なっているのです。
★いいえ、まったくソースのままです。★★

 firefoxで、[表示]→[スタイルシート]→[スタイルシートを使用しない]を選択すると良く判ります。(IEでも可能です。Chromeは不可能)
>「表示されたページ内容のソース」と「読み込み先のURL」を知る方法はないでしょうか?
 firebugで調べるのが簡単でしょう。firefoxで「ページの情報」でも良い。

 例えば、
ナビゲーションリストを様々にデザインしてみよう。( http://www.ichiya.com/WebService/Howto/sample/HT … )
 にて、ソース表示をしたのち、[表示]→[スタイルシート]→で色々なスタイルを選択したり、印刷プレビューで印刷を確認するとわかるように、HTMLの文書構造が変わっているわけではありません。--HTMLには文書構造しか書かない。プレゼンテーションはスタイルシートで行なう。
 ⇒構造とプレゼンテーションの分離( http://www.asahi-net.or.jp/%7Esd5a-ucd/rec-html4 … )

 ページを描画するために、画像やjavascript、スタイルシートはテキストだけのページを除いて必ず読み込まれます。HTTP通信+HTMLなどの特徴です。
1)サーバーに対してファイルを要求する。
 GET:/page/index.html
2)そのファィルを開き、他に必要なファイルがあれば【改めて】サーバーに要求する。
 GET:/img/logo.gif
 あるいは、GET:/js/abc.js とか、/css/abc.css とか
3) それらのファイルがさらに他のファイルを必要とするなら
  /css/abc.css 内に url(/img/logo/abc.gif)とあれば
  GET: /img/logo/abc.gif
4) 最終的にすべてのファイルがそろうと描画
 ・・・揃わなくても揃った物だけで
    • good
    • 0
この回答へのお礼

情報ありがとうございます。申し訳ございませんが、仕組みが少し理解できたということで、頂きたかった回答とは異なっておりました。
ただ、仕組みについてはだいぶ理解できた気がします。

ありがとうございました。

お礼日時:2015/07/10 15:26

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!