プロが教える店舗&オフィスのセキュリティ対策術

下記のような文字列からhttp://.......jpや....pngなどの部分だけ抜き出したいのですがどうすればいいかわかりません。
どうすればいいでしょうか??
<img src="http://i.yimg.jp/images/bloom/v201212/anonymous_ … width="24" height="24">
<img src="http://i.yimg.jp/images/clear.gif" alt="??????????????" width="1" height="1">
<img src="http://amd.c.yimg.jp/im_siggUafHxX5zBqYXXUl0MFuD … width="172" height="200" alt="???????????????????????????????????????????????????????" onContextMenu="javascript:return false;">
<img src="http://i.yimg.jp/images/news/cobranding/dal.gif" alt="????????????" width="170" height="40">
<img src="http://iwiz-talent.c.yimg.jp/im_siggAkAHOLx3UJ96 … alt="???????????" border="0" width="80" height="80">
<img src="http://i.yimg.jp/images/news/v2/loading_32_b_2x. … width="32" height="32">
<img src="http://amd.c.yimg.jp/im_siggdUHHiAjMx0Vtxw6UiBjX … alt="?????????????????????????????????Ф????????????">
<img src=" http://i.yimg.jp/images/evt/sochi/images/banner3 … alt="????????????????????????" width="300" height="90">
<img src="http://lpt.c.yimg.jp/im_siggOxcR1sffKraZiSLM4Tvl … alt="????????????μ???????????裲?????????Τ???">
<img src="http://lpt.c.yimg.jp/im_siggd24L.DRjsSsOFQzvcUud … alt="???Ρ???????Ф???????????????????????">
<img src="http://lpt.c.yimg.jp/im_sigg5ySCgAEx9Mr.pAnTk_BL … alt="?????????????????????Ρ?????????">
<img src="http://lpt.c.yimg.jp/im_siggbLLaxB6uLw4PgQNbIotT … alt="???????????????Τ????????????????????????????????????????">
<img src="http://amd.c.yimg.jp/im_sigg9vWalgQCOQonMxnTWgrp … alt="??????????????????????????????????????????">
<img src="http://i.yimg.jp/images/clear.gif" width="1" height="1" alt="?????????????">
<img src="http://i.yimg.jp/images/clear.gif" alt="???Υ???????????" width="1" height="1">
[Finished in 0.9s]

A 回答 (3件)

img要素内のURLでしたら、


m/<img src="([^"]*)/
で良いでしょう。
Perlは最長マッチですので、
<img src="" width="" height="" alt=""><img src="" width="" height="" alt="">
のような場合・・最初のsrc="から行末の"にマッチチしないようにする必要があります。
    • good
    • 0

1. CPAN のモジュールで DOM とか スレイピング とかを導入


2. 文字列をHTMLとして解析する
3. 解析結果から、要素imgの属性srcを全て取得 (たとえばXPATHで "//img@src" とか)
4. src の中身をURIとして解析する
5. 解析結果から、ホスト名とかファイル名を取得
    • good
    • 0

m/src="(.*?)"/;

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!