プロが教える店舗&オフィスのセキュリティ対策術

Perlに詳しいかたで、もしIE6を制御する方法をご存知のかたがいらっしゃい
ましたら教えてください。

<環境>
自宅のWindowsXPにて、ActivePerlとIE6を使用しております。


先ず、Perlとは無関係に、IE6にて適当なページを表示させて
『ファイル』→『名前をつけて保存』
と実行しますと、htmlファイルの他に、そのhtmlファイルに使われている画像
データも保存されると思います。

そして、私の知っているPerlの記述で『getstore』というものがありますが、
この方法ですと、htmlのソースファイルはDL出来るものの、画像データなど
は保存されませんので、DLしたhtmlを表示させても、画像のリンク先が無い
というエラー表示になってしまいます。


別途IEの制御ソフトなどありましたらそれを仲介してでも構いませんので、
Perlで複数のHPを一括DL出来る方法をご存知でしたら教えてください。

IE6にて毎回『ファイル』→『名前をつけて保存』とするのが面倒なだけで
単純作業はバッチファイル化したいだけなのですけど、宜しくお願いします。

A 回答 (2件)

HTMLのリンク先までチェックするPerlベースのソフトは知りませんが、Windowsで動作するサイトのページをダウンロードするフリーウェアならいろいろと有ります。


それではダメなのでしょうか?
いろいろと使ってきましたが「巡集」というのがシンプルで高機能なので気に入っております。
    • good
    • 0
この回答へのお礼

ありがとうございます。

『巡集』というツールを使ってみましたけれども、GUIでしか動かなそう
でしたので、その近辺のツールでコマンドラインから動かせるものを検索
した結果、『wget』というツールに辿り着きました。

現在、特定のHPのみ、しかもDL後にリンクファイルへのpathの若干の
手修正などありますけど、なんとか動くものに仕上がっています。

もっと勉強をすれば、汎用的なプログラムになると思うのですけれど、
Perl自体が『独学』ですので、時間がかかりそうです。

お礼日時:2009/12/04 05:59

そんな難しい話でもないので、Perlを使えるなら自分で書いてみたら如何でしょう。

SocketでHTML内に記述されたリソースを片っ端から取得してローカルに保存するだけです。
フリーソフトを使うにしてもUAで弾かれたりパスがスクリプトで記述されていたり可変だったりすると対応できないケースが多いので、作れるなら自分で作った方が何かと汎用が効きますよ。
    • good
    • 0
この回答へのお礼

ありがとうございます。

Perlは、ゼロから書けるほどの知識はありませんで、たいていはどこか
から持ってきてはそれを流用して使用しているのですが、『socket』と
いうキーワードで引っ張ってきた長いプログラムの結果も、『getstore』
と同じ結果でしたので、1行で済む『getstore』を引き続き使うことに
しました。

問題は『HTML内に記述されたリソースを片っ端から取得して…』という
ところですが、保存フォルダの関係とhtml内のリンク先URLの記述変更の
関係で、現在は特定のHPのみの対応になってしまっています。

汎用性に富んだプログラムにするには、まだまだ時間がかかりそうです。

お礼日時:2009/12/04 06:00

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!