PHPで外部サイトのHTMLソース内の特定のURLを取得するにはどうすればいいでしょうか?
具体的には楽天市場の個別商品ページのHTMLソースにあるレビューページのURLを抽出したいと思っています。
ttp://item.rakuten.co.jp/asagao/332/のHTMLソースから
レビューページのURLのttp://review.rakuten.co.jp/item/1/229861_10000050/1.1/を取得するようなプログラムを作りたいと思っています。
自力で頑張ってみたもののPHP初心者のため、preg_matchや正規表現でお手上げ状態になってしましました。
プログラムのソースコードを教えていただけると助かります。
ご回答よろしくお願いします。
No.3ベストアンサー
- 回答日時:
うーん。
授業料が欲しいくらいだけお。
でも暇だっから今回は許すお。
僕に感謝するお。
---------------------------
// find all link
foreach($html->find('a') as $e){
$txt = mb_convert_encoding($e->plaintext, 'UTF-8', 'EUC-JP');
$href = mb_convert_encoding($e->href, 'UTF-8', 'EUC-JP');
if(strstr($txt, 'レビューを見る(') !== false ){
echo $href . ' : ' . $txt . '<br>';
}
}
---------------------------
URL抜き出す条件はソース見ればわかるお。
No.2
- 回答日時:
しょうがないなぁ。
ファイルをダウンロードしたら
/example/example_basic_selector.php
というファイルがあるから、
ブラウザからアクセスしてみよう。
すると、、、
あら不思議。
抽出されたURLが!
簡単だお。ソースコード必要ないお。
この回答への補足
詳しい説明ありがとうございます。
無事にURLは抽出できましたが、不要なURLも大量に抽出してしまいます。
目的の↓このURLのみを抽出するにはexample_basic_selector.phpをどのように改良すればいいのでしょうか?
ttp://review.rakuten.co.jp/item/1/229861_10000050/1.1/
No.1
- 回答日時:
この回答への補足
リンク先にあるScraping Slashdot!を応用するのでしょうか??
もう少し具体的にソースコードを教えていただけると助かります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- SEO googleサーチコンソールで、重複URLが多数発生、その修正方法について 2 2023/06/23 16:15
- PHP PHP MySql ページング 2 2022/09/20 06:38
- アプリ Edgeを操作するアプリについて 4 2023/05/11 22:48
- SEO googleサーチコンソールでの重複ページ(ダブルスラッシュ) 3 2023/06/12 15:00
- PHP アコーディオンPHPが上手くいかない 3 2022/07/15 16:29
- HTML・CSS ホームページにブログ記事をサムネイル付きで掲載する方法 2 2022/11/25 14:55
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- PHP PHPを使って、別サイトの一部を取得して表示したいのです。。 1 2023/01/18 21:45
- その他(プログラミング・Web制作) python 気象データの取得 2 2023/06/20 23:54
- HTML・CSS HTML と CSS 1 2023/03/07 06:50
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
リンク先を隠す方法はないでし...
-
phpでURLマッピング(?)は可...
-
画面が真白
-
フォントの色を変えるには?
-
onedrive にexcelファイルをア...
-
バッチを用いたフォルダの自動移動
-
PHPのif文でその処理を途中で抜...
-
fopenでファイルが開かない場合...
-
.phpと.incファイルの違いはな...
-
tplを読みに行けません。
-
Smarty includeでテンプレート...
-
「警告:ページの有効期限切れ...
-
ファイル一覧を表示しその画面...
-
eclipseのエラーの意味
-
mysql複数レコードをまとめて削...
-
makefile でファイルをコピーす...
-
透過PNGが透過されない!!
-
phpのextension_dirを複数指定...
-
CFileDialogの最初のディレクト...
-
XAMPPでSQL文を流すとフリーズ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
リンク先を隠す方法はないでし...
-
PHPで新しいウインドウで開く命...
-
csvデータをテーブル表示、指定...
-
RSSフィードをrss2.0で表示する...
-
jpgraphで表示されない
-
textareaのvalueについて
-
javascriptで切り替えて、php(...
-
PHPで外部のhtmlを読み込んでソ...
-
iphone/AndloidアプリをPHPで作る
-
暗号化されたファイルを作りたい。
-
PHPでTELNETを実装できる?
-
phpのページが白紙で表示される
-
クライアント側での検索結果の...
-
PHPの利点
-
PHPで作られていることがわかる...
-
英語圏で外注したソースが同じ...
-
htmlにコードを貼り、リファラ...
-
ページを開いて何秒か?
-
header("Content-type: applica...
-
静的HTMLにRDFを表示させる方法...
おすすめ情報