
いつもお世話になります。
wgetを使ってサイトの取得を色々試しています。
例:あるブログを取得。ブログは毎日更新されている。
昨日wgetでブログを取得。今日もブログを取得した場合、更新又は新規ファイルだけを取得したい。
条件で言えば『取得済みのファイルは取得しないが、タイムスタンプが変更している場合は取得する。勿論新規ファイルも取得』
オプションの-nc(取得済みファイルは取得しない)、-N(タイムスタンプを見る)を同時に指定すると以下のエラーが出ます。
「-Nと-ncとを同時には指定できません。」
何か方法はないのでしょうか?
宜しくお願いします。
No.1ベストアンサー
- 回答日時:
-Nだけで、
新規ファイルや 取得済みだがタイムスタンプが変わったファイルはダウンロードするとなります。
(つまり、取得済みでタイムスタンプも変わらないファイルはダウンロードしない)
-ncとちがって、HTTPヘッダだけは取得しに行きますので速度的には不利ですが。
この回答への補足
-Nだけで実行をしてみましたが、以下のメッセージが出ます。
hoge.jp をDNSに問いあわせています... 完了しました。
hoge.jp[***.*.***.***]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 13,158 [text/html]
Last-modified ヘッダがありません -- 日付を無効にします。
-Nの説明で、『Last-modified』とありますが、これがないので、上書きされてしまうようです。
----説明--ここから-------
タイムスタンプを比較し、ファイルが変更されたと判断されたなら上書きダウンロードを行う。ただし、対象ファイルが Last-Modified ヘッダもたない場合(CGIなどやサーバーが自動で生成するディレクトリリストなど)、とりあえず上書きダウンロードする。
----説明--ここまで-------
何故、Last-modifiedが取れないのでしょうか。。。
No.2
- 回答日時:
> 何故、Last-modifiedが取れないのでしょうか。
。。wget側の問題でなく、アクセス先のhoge.jp側からの戻ってくる
httpヘッダに存在していないのが問題です。
CGIとかで、静的コンテンツじゃないってことでは?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Winmerge ファイルの中身は同じ...
-
バッチファイルで変数の中身を...
-
onedriveの中身を削除したらパ...
-
office365 ファイルを削除したい
-
教えてください!困ってます。
-
ファイルの単位
-
emlをtxtに変換するには?
-
r00、r01、 r02… のrarファイル
-
共有フォルダ内のファイル使用...
-
WMP12のトラック番号編集...
-
アーカイブってなに?
-
Windows10 フォルダ内の自動並...
-
コマンドプロンプトによるフォ...
-
ファイル操作(削除など…)の履...
-
ファイルの先頭行を全て削除したい
-
シンボリックリンクからの被参...
-
エクスプローラーでプレビュー...
-
msiファイルをexeファイルに変...
-
.pkgというファイルについて。
-
このファイル何でしょうか(ntus...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Winmerge ファイルの中身は同じ...
-
onedriveの中身を削除したらパ...
-
教えてください!困ってます。
-
emlをtxtに変換するには?
-
コマンドプロンプトによるフォ...
-
office365 ファイルを削除したい
-
mrl→midファイルへ
-
バッチファイルで変数の中身を...
-
IPテレビのプレイリストだとお...
-
ファイルの単位
-
ファイルの先頭行を全て削除したい
-
ショートカットアイコンと、元...
-
VScodeでjarファイルを開く方法
-
macのdmgファイル(動画)をMP4...
-
Windows10 フォルダ内の自動並...
-
クラリスワークスのファイルを...
-
外字ファイル、eudc.tte と e...
-
ファイル操作(削除など…)の履...
-
outlookuの添付ファイルが開け...
-
Excelで保存時間とPCの時間があ...
おすすめ情報