ネストされているＲＳＳのデータ取り出し

締切済

質問者：sagawa126
質問日時：2012/07/25 01:25
回答数：1件

ＲＳＳからデータ取り出しについて、ご教授ください。

use XML::RSS;

をperlに実装して、ＲＳＳファイルを分解し、必要なデータだけ取り出すスクリプトを使用しています。

データがとれなくなったので、ソースを調べたところ、配布元が改造をしたらしく

<rss version="2.0">
<channel>
<title>ＲＳＳによる順位公開</title>
<item>
<title>タイトル１</title>
<rank>1</rank>
<preranks>
<rank>3</rank>
</preranks>
</item>
<item>
<title>タイトル２</title>
<rank>2</rank>
<preranks>
<rank>10</rank>
</preranks>
</item>

のようになっていました。
<rank> はそのときのタイトルの表示ランキングで、<preranks>は、ＲＳＳが更新される以前の表示ランキングを示しています。
ちなみに、preranks　からネストしている　rank　を別の表記にしたり、ネストしない構造に変更することは、対応できないとの回答でした。

$rss->parse( RSSのURL );

for (@{$rss->{'items'}}) {
$el00 = $_->{title};
$el01 = $_->{rank};
}

と実行すると、$el00は、タイトル１　や　タイトル２　と希望通りの形に分解できるのですが、$el01　は　13 や 210 など、<preranks>　の内側の　<rank>　と並べた数字で表示されてしまいます。

といって、 $el01 = $_->{preranks};　でも数字がとれません。

こうした構造のＲＳＳで、<rank>　と　<preranks>　をデータとして分解するには、どんな記述をしたらいいのでしょうか？

よろしくご教授お願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

最新から表示
回答順に表示

No.1

回答者： sawa25
回答日時：2012/07/29 01:14

XML::RSSモジュールを使って試してみましたが、パースがうまくいかないですね。

XML::RSSモジュールにこだわらなくていいのなら、XML::XPathモジュールを使えば、下記のようなスクリプトでパースができると思います。

#!/usr/bin/env perl
use v5.16;
use warnings;
use utf8;
use open IO => qw/:utf8 :std/;
use autodie;
use XML::XPath;

my $string = << 'EOF';
<?xml version="1.0" encoding="utf-8" ?>
<rss version="2.0">
<channel>
<title>ＲＳＳによる順位公開</title>
<item>
<title>タイトル１</title>
<rank>1</rank>
<preranks>
<rank>3</rank>
</preranks>
</item>
<item>
<title>タイトル２</title>
<rank>2</rank>
<preranks>
<rank>10</rank>
</preranks>
</item>
</channel>
</rss>
EOF

my $xpath = XML::XPath->new(xml => $string);
for my $item ($xpath->findnodes('//item'))
{
say 'タイトル：', $item->findvalue('title');
say '新ランク：', $item->findvalue('rank');
say '旧ランク：', $item->findvalue('preranks/rank');
}

実行結果は下記のとおりとなります。

タイトル：タイトル１
新ランク：1
旧ランク：3
タイトル：タイトル２
新ランク：2
旧ランク：10

XPathは一度覚えちゃえば、いろいろな場面で活用できます。
表示させたいところを細かく指定できるのが便利です。