電子書籍の厳選無料作品が豊富!

Perl初心者です。

下記のようなXMLファイル(test.xml)を、CSVに変換したいと考えています。
<MODESMESSAGE>
<DATETIME>20121129045500</DATETIME>
<MODES>8515C4</MODES>
<CALLSIGN>JAL1406</CALLSIGN>
<ALTITUDE>03075</ALTITUDE>
<GROUNDSPEED>177</GROUNDSPEED>
<TRACK>330</TRACK>
<VRATE>-832</VRATE>
<AIRSPEED>000</AIRSPEED>
<LATITUDE>35.4003</LATITUDE>
<LONGITUDE>139.8822</LONGITUDE>
<SQUAWK>3341</SQUAWK>
</MODESMESSAGE>
<MODESMESSAGE>
<DATETIME>20121129045500</DATETIME>
<MODES>86CF11</MODES>
<ALTITUDE>20100</ALTITUDE>
<VRATE>0</VRATE>
<AIRSPEED>000</AIRSPEED>
<LATITUDE>0</LATITUDE>
<LONGITUDE>0</LONGITUDE>
</MODESMESSAGE>

データによって、要素が欠けている場合もありますが、最大で11個の要素が並んでいます。

これをCSVに変換するため、書籍を参考にしながら以下のスクリプトxml2csv.plを作りました。
使用している環境はLinuxです。

use encoding "utf8", STDOUT=>"Shift_JIS";
use XML::Parser;

$parser = new XML::Parser( Handlers =>
{Start=>\&element_start,
Char => \&cdata,
End => \&element_end});

$element_name = '';
%records = {};

eval ( "\$parser->parsefile( \@ARGV[0] );");

if ($@) {
chomp($@);
$@ =~ s/^\n//;
$@ =~ s/ at (?:[A-Z]:)?\/.*//;
print @ARGV[0] . " :Error $@ \n";
}

sub element_start {
my ($expat, $name, %attributes) = @_;
$element_name = $name;
$records = {} if ( $name eq 'MODESMESSAGE' );
}

sub element_end {
my ($expat, $name) = @_;
if ( $name eq 'MODESMESSAGE' ) {
print $records{'DATETIME'} . "," . $records{'MODES'} . "," . $records{'CALLSIGN'} . "," . $records{'ALTITUDE'} . "," . $records{'GROUNDSPEED'} . "," . $records{'TRACK'} . "," . $records{'VRATE'} . "," . $records{'AIRSPEED'} . "," . $records{'LATITUDE'} . "," . $records{'LONGITUDE'} . "," . $records{'SQUAWK'} . "\n";
}
$element_name = '';
}

sub cdata {
my ($expat, $context) = @_;
$records{$element_name} = $context if ($element_name);
}

実行すると、
> perl xml2csv.pl test.xml
20121129045500,8515C4,JAL1406,03075,177,330,-832,000,35.4003,139.8822,3341
test.xml :Error junk after document element at line 14, column 0, byte 345
>
上記の通り1つ目のデータについてはCSVに変換できているようなのですが、2つ目以降が変換されずエラーとなってしまいます。

お気づきの点がありましたら教えていただけないでしょうか。
よろしくお願いします。

A 回答 (2件)

test.xml の中身を



<XMLDOC>
<MODESMESSAGE>
...
<MODESMESSAGE>
<MODESMESSAGE>
...
<MODESMESSAGE>
...
</XMLDOC>

のようにタグで挟めば、よいと思う。 <XMLDOC> は単なる例で別に何でもよい。

よく知らないんだけど、挟まないとひとつの XML 文書にならないのじゃないかな ???

この回答への補足

t-okura 様

ご回答いただき、ありがとうございます。
test.xml の先頭・最後の行にそれぞれ以下の行を追加しました。
<XMLDOC>
...
</XMLDOC>

下記のように実行したところ、2つ目のデータについても変換できました。
ありがとうございます。
> perl xml2csv.pl test.xml
20121129045500,8515C4,JAL1406,03075,177,330,-832,000,35.4003,139.8822,3341
20121129045500,86CF11,JAL1406,20100,177,330,0,000,0,0,3341

上記の結果について重ねてお聞きしたいのですが、
test.xmlにおいて2つ目のデータでは、CALLSIGN、GROUNDSPEED、TRACK、SQUAWK等の要素がないため、
1つ目のデータの値がクリアされずにそのまま出力されてしまっています。
データがない場合は0または文字を消去して「,0,」または「,,」となるようにしたいのですが、
その場合どこを修正すればよろしいのでしょうか。

お手数をおかけします。
よろしくお願いします。

補足日時:2012/12/01 21:27
    • good
    • 0
この回答へのお礼

ありがとうございます。
各値をクリアすることで必要とする結果を得ることができました。

お手数をおかけしました。
おかげさまで助かりました。

お礼日時:2012/12/02 00:26

初期化するかてきとうに my.

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!