ある文字列中に次のほぼ同値なinputタグ、１：２：３：がある場合、この中からtext, A, B を抽出しようと思っています. （さらに、１，２のA, B に半角スペースが含まれる場合も考慮）自分なりの方法の概略は、 $_ = $str; ~ /( ]*?>)/; $tag = $1; として、を得て、 $tag =~ /name=[\"']{0,1}([^\"']*?)[\"']{0,1}[\s\t>]/i $name = $1; $tag =~ /value=[\"']{0,1}([^\"']*?)[\"']{0,1}[\s\t>]/i $value = $1; としていたのですが、nameとvalue値が\sを含む場合や、タグの中の"と"の間に > が含まれる場合に正しく動作しません。何いい方法はないでしょうか.

タグの中のname, value値の取得

解決済

質問者：ytse
質問日時：2005/09/21 21:43
回答数：2件

ある文字列中に次のほぼ同値なinputタグ、
１：<input type="text" name="A" value="B">
２：<input type='text' name='A' value='B'>
３：<input type=text name=A value=B>

がある場合、この中からtext, A, B を抽出しようと思っています.
（さらに、１，２のA, B に半角スペースが含まれる場合も考慮）

自分なりの方法の概略は、
$_ = $str;
~ /(<input[^>]*?>)/;
$tag = $1;

として、<input・・・>を得て、

$tag =~ /name=[\"']{0,1}([^\"']*?)[\"']{0,1}[\s\t>]/i
$name = $1;

$tag =~ /value=[\"']{0,1}([^\"']*?)[\"']{0,1}[\s\t>]/i
$value = $1;

としていたのですが、nameとvalue値が\sを含む場合や、<input>タグの中の"と"の間に > が含まれる場合に正しく動作しません。
何いい方法はないでしょうか.

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： steel_gray
回答日時：2005/09/22 01:07

正規表現だと面倒そうだし、応用も利くのでHTMLを解析するモジュールを使ってみては？

以下、ちょっと長いけど例。

my $str = <<HTMLDATA;
<input type="text" name="A" value="B">
<input type='text' name='A' value='B'>
<input type=text name=A value=B>
HTMLDATA

use HTML::Parser();
my $parser = HTML::Parser->new(
api_version => 3,
start_h => [\&startTag, "tagname,attr"],
);
$parser->parse( $str );
$parser->eof;
exit;

sub startTag {
my($tagname,$attr) = @_;
if($tagname eq 'input') {
print 'name="',$attr->{name},'" value="',$attr->{value},"\"\n";
}
}

参考URL：http://homepage3.nifty.com/hippo2000/perltips/ht …

- 0
- 件

通報する

この回答へのお礼

パーサを使うといいのですね。
先ほど、cgi-lib.plの中身を眺めながら
正規表現で解決しようと四苦八苦していました..

実を言うと使っているのはPHPなので、XML Parser 関数あたりを
利用すればいいのでしょうか。
いろいろ調べてみます.

ありがとうございました。

通報する

お礼日時：2005/09/22 02:36

No.2

回答者： BLUEPIXY
回答日時：2005/09/22 02:10

正規表現だと、こういう解析が困難です。

自分で解析するのもいいけど、モジュールを使うと楽ちん
HTML::TokeParserを使った例

use HTML::TokeParser;

$str=<<DATA;
１：<input type="text" name="A" value="B">
２：<input type='text' name='<A>' value='<B/>'>
３：<input type=text name=A value=B>
DATA

$parser = HTML::TokeParser->new(\$str);
while($token = $parser->get_token()){
#$token : [ type tag attribute_hash ]
if($token->[0] eq 'S' && $token->[1] eq 'input'){
$name = $token->[2]{'name'};
$value = $token->[2]{'value'};
print "name=$name\n";
print "value=$value\n";
}
}