dポイントプレゼントキャンペーン実施中!

Perlにて外部サーバーよりHTMLを読み込むスクリプトを書いていますが
万策付きお手上げとなりました。なんとか実現したく御願い致します。
環境から申し上げます。
作成パソコン OS → WIN98
ウェブサーバー → ANHTTPD
ActivePerl 5.8.7 Build 813
です。

以下がコードです。


use Socket;
use Net::hostent;
#ローカルホスト名
$localhost='localhost';
#リモートホスト
$remotehost='127.0.0.1';
#得たいページのURL
$page = 'http://127.0.0.1/index.html';

#接続し、ファイルハンドルSHにつなぐ。
$rh = gethost($remotehost);
$lh = gethost($localhost);

$proto = getprotobyname('tcp');
socket(SH,AF_INET,SOCK_STREAM,$proto) or print "error\n";
$port = getservbyname('http','tcp');
$socket_template='S n a4 x8';
$localhost_port = pack($socket_template,AF_INET,0,$lh->addr);
$remotehost_port = pack($socket_template,AF_INET,$port,$rh->addr);
bind(SH,$localhost_port) or print "error\n";
connect(SH,$remotehost_port) or print "error\n";
select SH;
$|=1;

#GETでリクエストを送信。
print SH "GET $page\n";

#得られたページの内容を@HTMLに入れる。
while(<SH>){
push @HTML,$_;
}

close SH;

select STDOUT;

#追加書き込みでhtml.txtを開く。
open(FILE, ">> html.txt");

#@HTMLがhtml.txtに書き込めない。
foreach (@HTML){
print FILE $_;

}

close(FILE);


print <<EOD;
content-type: text/html


<html>
<head>
<title>新規登録</title>
<link rel="stylesheet" href="shinki.css" type="text/css">
</head>
<body>
<h1>サーバーチェック</h1> <br><br>
HTMLさくせいしました。<br>

@HTML

</body>
</html>

EOD

exit;
以上です。

当然ながらブラウザにも表示されません。
コードの細かい事などもよく分かっていません。
お手数ですが
外部ファイルの取得が出来ますよう
ご教授宜しく御願い致します。

A 回答 (1件)

> print SH "GET $page\n";


これじゃダメです。ちゃんと http プロトコルに従ってリクエストを出しましょう。
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616 …
・GET コマンドは、プロトコルバージョンを指定する必要がある
・リクエストが終わりであることを示すために、空行を出力する必要がある
というわけで、最低限だと
print SH "GET $page HTTP/1.0\n\n"
で動作する場合が多いと思います。
ただし、これで動くのはタマタマというかサーバ側の親切のおかげですので、
もうちょっと手堅くやるなら

$page =~ m#http://([^/]+)(/.*)$#;
$host=$1;
$path=$2;
print SH "GET $path HTTP/1.1\n"; # "GET /index.html HTTP/1.1\n"
print SH "Host: $host\n"; # "Host: 127.0.0.1\n"
print SH "\n";

といった感じで。

でも、こだわり始めるときりがないので、そういうのは
HTTPプロトコルに基づいたページ取得ライブラリを利用する方が簡単です。
例えば、LWP::Simple を使えば、
http://homepage3.nifty.com/hippo2000/perltips/LW …

use LWP::Simple;
$html = get('http://127.0.0.1/index.html');

と、実質たった1行でページ取得ができます。
    • good
    • 0
この回答へのお礼

mtaka2様
早々のご回答誠にありがとう御座います。
お陰さまでウェブ上のHTMLファイルが取得出来るようになりました。
詳しい事は分かりませんのでこれから勉強しようと思います。
また参考サイトと特に
use LWP::Simple;
$html = get('​http://127.0.0.1/index.html');
は非情にありがたかったです。
私にとって正に目からうろこ状態でした。
拝借いたしましたお時間にもお礼申し上げます。
本当にありがとう御座います。
<(_ _)>

お礼日時:2008/12/09 02:44

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!