ちょっと先の未来クイズ第5問

Irvineでリンクを追跡して取得し、必要URLだけをダウンロードしたいのですが
うまくいきません。

アドレス
http://サイト.com

ダウンロードしたいURL
http://サイト.com?a=01

ダウンロードしたくないURL
http://サイト.com?b=02
http://サイト.com?c=03
http://サイト.com?d=04
http://サイト.com?b=02&c=03
http://サイト.com?d=04&b=02
http://サイト.com?d=04&c=03&b=02
以下たくさんあります。
postで順不動で発生します。

フィリタ設定で所得しないURLの設定はうまくいくのですが
所得したい設定の仕方がわかりません。

お手数かけますが基本的な設定をを教えてもらえないでしょうか?
よろしくお願いいたします。

A 回答 (2件)

ああ、失礼しました



後で見直して気がつきました
 http://サイト.com?b=0[^1].*
ですね

"「http://サイト.com?b=0」で始まり「1」以外の文字が続く全て”をフィルタする設定です

正規表現を覚えるとのちのち便利に使えるかもしれません
この際ですので覚えてしまいましょう
    • good
    • 0

取得したいURLの設定などありません



普通にURLをたどって不要なURLの【ホスト名】をフィルタすればその先からデータを取得することはありません
あとは、【正規表現】を使ってフィルタするURLを指定するくらいですね
 http://サイト.com?b=0[^1]
などとしてみては如何でしょう
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報