電子書籍の厳選無料作品が豊富!

テキストファイルに格納された、httpから始まり.htmlで終わるURLと、httpから始まり.jpgで終わるURLのみを抽出してuniqにかけたいのですが、どのようにすればよろしでしょうか。

grep -o http*html ファイル名
grep -o http*jpg ファイル名

上記を試しているのですがうまくいきません。

A 回答 (3件)

grep -o -e 'http[^"]*html' ファイル名


grep -o -e 'http[^"]*jpg' ファイル名

正規表現
https://tech.nikkeibp.co.jp/it/article/COLUMN/20 …
    • good
    • 0

httpとhtmlのキーワードが各行にそれぞれ一つ以下だという前提ならこれでURLだけ抽出できると思います。


grep -o "http.*\.html" file
    • good
    • 0

httpの前とhtmlの直後はどうなってるんですか?スペースそれともほかの文字?


あと、httpで始まって.htmlで終わるURLが同じ行に複数あるケースはあるんですか?
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!