こんにちは
phpを使ってrssを配信している
サイトのhtmlデータを取得し、
rssのリンクが書いてある<link>タグを抽出しようとしています。
preg_matchなどを使った抽出の時に使っている正規表現は一応、
|.*<link rel=[\"\']alternate[\"\'](.*rss.*xml.*)?>|s
なのですが、上記のrss xmlという文字列の順序や、
rssのバージョンを考えずに取得できる方法、
タグ内の他の属性値、属性値の順序など、
人によって書き方が異なり、
取得が難しいです。
これ以外の、より簡単な取得方法や、抽出におけるよい正規表現を知っておられる方、
どうか抽出方法を教えていただけませんでしょうか?
A 回答 (2件)
- 最新から表示
- 回答順に表示
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- HTML・CSS 別サイトのHTML内にある情報を自動取得して、自分のサイトに組込む方法を教えてください。 例えば、Y 1 2023/06/15 08:09
- gooブログ gooブログについて 1 2022/05/09 09:46
- JavaScript オブジェクトから任意のプロパティを全て抽出する一番簡単な方法 1 2023/08/09 21:13
- その他(プログラミング・Web制作) パイソン。スクレイピング。Chromeドライバーの使い方を教えてください。 1 2023/06/14 21:55
- Visual Basic(VBA) 3つのプロシージャをまとめたら実行時エラー発生で対応不能 6 2022/05/17 01:47
- PHP SQLとPHPの連結方法がわからないのでアドバイスお願い致します 1 2022/07/12 12:16
- Excel(エクセル) VBA : スクレイピングできない 4 2023/05/12 22:26
- Excel(エクセル) エクセルで重複データを行ごとに抽出したい 4 2022/12/05 08:18
- PHP 配列の値の更新方法について 1 2022/08/05 09:49
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ミュージックのアートワークを...
-
【PHP】APIやRSSが存在しないサ...
-
perl LWPでURLにアクセスした時...
-
別サイトのHTML内にある情報を...
-
ローカルのコンピュータ名を取...
-
GoogleやYahoo!で検索したサイ...
-
特定のハッシュタグのツイート数
-
URLからタイトルを取得したい!
-
積立投資してます。現在平均取...
-
Yahoo! JAPAN IDを新規取得でき...
-
ps3で久しぶりにCDの音楽情報取...
-
Windows バージョン(種類)の...
-
【VBA】EXCELブックを開かずに...
-
自分の掲示板にアクセス解析を...
-
メールヘッダーの解析について
-
jpg画像の縦と横のピクセル単位...
-
一つのアドで各サイトに自動転送
-
VBで現在の壁紙を取得、フルパ...
-
switch()文で値の大小比較
-
DTOとEntityの差は何ですか。
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
「取得先」という表現について
-
IEを使わないでhtmlテキストを...
-
Yahoo! JAPAN IDを新規取得でき...
-
自動車教習所について 質問 普...
-
アクセスの度にIPアドレスを変...
-
format関数について
-
Excel VBA:特定の文字列以降(...
-
ローカルのコンピュータ名を取...
-
不正競争防止法に該当するので...
-
ps3で久しぶりにCDの音楽情報取...
-
【VBA】EXCELブックを開かずに...
-
PHP の cURL で、htmlを画像へ...
-
VBS「開いているページ」のURL...
-
VBAでPDFファイルの文書のプロ...
-
ミュージックのアートワークを...
-
EXCEL、マクロ-改ページ行番号...
-
各クライアントマシンのログイ...
-
VB or VBScriptでPCの製造番号...
-
IPアドレスとMACアドレスを取得...
-
【C#】FindWindowExの使い方を...
おすすめ情報