
perl初心者です、いまperlのプログラムを書いていてxmlのデータとのマッチングをしようとしているのですが
<nanka>
<hoge>4</hoge>
</nanka>
<data>1</data>
<hoka>1</hoka>
このような部分があった場合に
</nanka>
<data>1</data>
ここの1のみを取り出したくてマッチングを考えているのですが
/</nanka>.<data>(.*?)<\/data>/s;
ではうまくいかず、困っています。
なにか良い方法、もしくはこのようなマッチングは不可能など
ご意見いただければと思います。
よろしく御願いします。
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
整形式の XML文書 (平たく言えば「正しい XML文書」) であるための条件の 1つに「ルート要素が 1個だけある」というものがあります. ところがこの質問文にある形ではルート要素が 3個あります. つまりこれは整形式ではない (分かりやすく言えば「正しくない」) わけです.
ルート要素をでっちあげて
<root>
<nanka>
<hoge>4</hoge>
</nanka>
<data>1</data>
<hoka>1</hoka>
</root>
とすれば整形式の XML文書になる. そうすれば, XPath で「nanka要素の直後の data要素」を指定するだけ.
No.3
- 回答日時:
use feature qw(say) ;
$_='<nanka>
<hoge>4</hoge>
</nanka>
<data>1</data>
<hoka>1</hoka>
<chigai>
<hoge>4</hoge>
</chigai>
<data>1</data>
<hoka>1</hoka>
' ;
if( /<\/nanka>.<data>(.*?)<\/data>/s ){
say $1;
}
これでちゃんと 1 と出力されます。
具体的に、どう「うまくいかず、困って」いるのですか?
・質問にある通り、</nanka>の/のエスケープ忘れで、エラーになっている
→/をエスケープする。
あるいは、/を多用するパターンなら、 mを使って、デリミタを/でないものにすると便利です
例: mX<\/nanka>.<data>(.*?)<\/data>Xs
http://perldoc.jp/docs/perl/perlop.pod#Regexp32Q …
・<\/nanka>と<data>の間が「1文字」ではない。(CR+LFで改行されているファイルをそのまま読みこんでいる、改行が無い、末尾に空白がある、等)
→事前に処理しておく(CRLFならCRを削除、末尾の空白ならs/\s+$//gm等)
→ . ではなく、 \s* にしてみる
ありがとうございます。
タグ中の値がとれなくて困っていました。
ご指摘頂いた通り、エスケープを忘れていたりと初歩的な部分がまだ直っていなかったことと
どうもまだ正規表現の理解が足りないことがわかりました。
詳しい開設とサンプル、またサイトを教えていただきありがとうございます。
No.1
- 回答日時:
XML を処理するならそれなりなモジュールを使った方がいいような気はするけど....
とりあえずどう「困っている」んでしょうか?
この回答への補足
モジュールも使ってみたのですが、
二行に渡ってマッチした場合にのみダグの中の値取れなくて断念しました。。
このxmlは
<nanka>
<hoge>4</hoge>
</nanka>
<data>1</data>
<hoka>1</hoka>
<chigai>
<hoge>4</hoge>
</chigai>
<data>1</data>
<hoka>1</hoka>
というような部分もあって、</nanka>のあとのタグの場合のみ
値を取りたくて…
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
INDIRECT 横に再度抽出したい
-
Strawberry Perl for Windows ...
-
perlのプログラミング 部分入れ...
-
Perlでファイルの末尾から指定...
-
perl の open について教えてく...
-
Perl言語について。
-
ファイルをディレクトリ分配の...
-
アルファベットに付いて質問し...
-
#!/usr/bin/perlで書きだしたCG...
-
Perlのエラーについてご教授く...
-
perlのflock関数でロックをかけ...
-
AI sisterとは、偽物の人ですか?
-
bashスクリプト
-
ファイルアイコンの左下に緑の□...
-
perlプログラミング 空白行削除
-
perlでリテラル値はメモリにど...
-
perlで2次元配列をサブルーチ...
-
Perlで時間の計算
-
perlについて
-
perlのrequireの動き方について...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
テキストファイルで提出とは?
-
Perlのエラーについてご教授く...
-
perlをバージョンアップしたら...
-
Perlで時間の計算
-
Wallpaper Engineでおすすめの...
-
Perl言語について。
-
perlで2次元配列をサブルーチ...
-
Strawberry Perl for Windows ...
-
#!/usr/bin/perlで書きだしたCG...
-
perl の open について教えてく...
-
INDIRECT 横に再度抽出したい
-
アルファベットに付いて質問し...
-
openした後、closeしないでプロ...
-
画像が表示でnull; this.src
-
VBA変数をFunction.VLookupの戻...
-
perlのflock関数でロックをかけ...
-
Perl の外部モジュールの利用方法
-
TeraPadエディターの操作方法に...
-
bashスクリプト
-
perlの構文でカンマの意味が分...
おすすめ情報