PerlでＨＴＴＰ～取得できないページがあるのですが。

解決済

質問者：com1000
質問日時：2008/09/13 19:44
回答数：3件

任意のページを取得するために、ＡＳＨさんのスクリプトを使ってい
ます。
ところが、どうにも取得できないページがあります。
ブラウザでは見れるのに、このスクリプトでは取得できません。
ダンプをとってみると、404not foundが返却されます。

想像ですが、この場合のアドレスは、「別名」なのでしょうか？

ブラウザでは見られるのだから、なにか方法があると思いますが、
その方法がわかりません。

ASHさんのスクリプトは、
http://ash.jp/perl/socket_http.htm
にあります。

たとえば、
http://www.icn.ne.jp/~akatuki/furu0.htm
http://www.icn.ne.jp/~furukawa/
は、このスクリプトでは読み取れません。
ここのプロバイダのサーバ上にあるＨＰは、全てそのようです。
また他のＳＰでも、このような所があります（少ないようですけど）。

こうなる理由と、対処方法（読み取る方法）をお願いします。

よろしくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： osamuy
回答日時：2008/09/13 20:31

> #$http = '1.1';

のシャープを外してないとか。

私が的外れかも。

- 0
- 件

通報する

この回答へのお礼

ありがとうございました。
>私が的外れかも。
どころか、
これをはずしたら、ドンピシャ！
うまくいきました。

コード的に見ると、このサーバーはHTTP1.1しか
サポートしていないということですね。
1.1の判断ではじかれてelse{}を実行したけれど、
「なにそれ？」と、知らん顔されたということでしょう。

とすると、この判断の前にサーバーに、「あんたのVerは？」
って聴いて分岐させるべきだとおもうのですが、
その方法はあるのでしょうか？

通報する

お礼日時：2008/09/16 00:56

No.3

回答者： jjon-com
回答日時：2008/09/17 10:14

>この判断の前にサーバーに、「あんたのVerは？」

>って聴いて分岐させるべきだとおもうのですが、
>その方法はあるのでしょうか？

Webサーバに適当なHTTP要求を送信すれば，それに対するWebサーバからのHTTP応答の中にHTTPバージョンを示す値が含まれていますので，それを検査することになります。CGIプログラミングの入門書に解説が載っているでしょう。

ただ，今回のご質問の場合は。
HTTP/1.0のWebサーバ，HTTP/1.1のWebサーバ，ともにそのWebページを取得できればいいという最も基本的なニーズですから，単にHTTP/1.1要求を送信すればよいはずです。

RFC2145「HTTPのバージョン番号の使い方と解釈について」を参照。
http://www.tech-web.net/note/RFC2145.html#version

- 0
- 件

通報する

この回答へのお礼

ありがとうございます。

>Webサーバに適当なHTTP要求を送信すれば，それに対するWebサーバか
>らのHTTP応答の中にHTTPバージョンを示す値が含まれていますので
ダンプを取ってみましたので、404not foundを返したときでも、
ヘッダにそれが含まれているのは知っています。それを抜き出すのは
簡単なのですが、もっとスマートに取得できないかと、思った訳です。

>CGIプログラミングの入門書に解説が載っているでしょう。
私自身、Perlの入門書でHTTPプロトコルについて、Perlとの関連で
書かれたものは知りません。
CGIプログラミングは、特定の言語を指すものではないので、
他の言語の入門書には書いて有るのかも知れませんね。
プロトコルについてはあまりヨク知らないので、Perlに関連した入門書
で、HTTPに関して書かれた書籍があれば、ご紹介願います。

>HTTP/1.0のWebサーバ，HTTP/1.1のWebサーバ，ともにそのWebページを>取得できればいいという最も基本的なニーズですから，単にHTTP/1.1
>要求を送信すればよいはずです。
おっしゃるとうりです。
オリジナルでは、その部分がコメントアウトされていて、上手く
いかなかったことは、 osamuy（No.1）さんのご指摘の通りでした。

>RFC2145「HTTPのバージョン番号の使い方と解釈について」を参照。
>http://www.tech-web.net/note/RFC2145.html#version
ありがとうございました。
勉強になりました。