置換演算子についての疑問

Question

お世話になっております。horagaiです。質問160286
http://oshiete1.goo.ne.jp/kotaeru.php3?q=160286
と同じようなことをやりたかったので回答#2のやり方を
試してみました。そこでいろいろ疑問が出てきたので教えていただきたいと思います。

（１）

$num=<> ;
while($num =~ s/(.*\d)(\d\d\d)/$1,$2/g){;}
print "num=$num
";

とするとたしかにうまくいくのですが、これでうまくいく理由がわかりません。
置換演算子が後ろからパターンマッチをしていくのだとすればわかるのですが。
前からだとするとたとえば123456は最初に(1)(234)56で引っかかって1,23456 。
次に (1,2)(345)6 で引っかかって1,2,3456 ・・・。
などとなりそうな気がします。

（２）
またwhileを使わずに

$num =~ s/(.*\d)(\d\d\d)/$1,$2/g;

としてみると 例えば入力が 12345678 とすると
num=12345,678
と最初の3桁しか区切ってくれません。マニュアルを見ると
「gオプションは出現したパターンをすべて置換する。」
と書いてあるのにどうしてでしょう。
前からマッチするせよ後ろからマッチするにせよカンマが１つしか
入らないということはないと思うのですが。

以上、私が根本的な勘違いをしているかも知れませんので
その辺のところもご指摘いただければ幸いです。
ちなみにOSはLinux.Perlのバージョンは5.004です。

noname#25358 · Accepted Answer

えとですね。
　正規表現には１つの原則がありまして。

　たとえば、123456789だと、可能性として、

　　1,23456789
　　12,3456789
　　123,456789
　　1234,56789
　　12345,6789
　　123456,789

　これらすべて、マッチする可能性がありますよね。
　そういうパターンであることはわかりますか？

　で、正規表現は、「マッチする可能性の中から、もっとも文字列の長いものを採用する」という原則があります。
　ですので、.* にひっかかる可能性のあるうちで、もっとも長い文字列である 12345 がひっかかってるわけです。

　これは正規表現すべてで統一されていて、最長マッチといいます。
　逆に、もっとも短い可能性を採用させるには、

　 (.*?\d)(\d\d\d)

　と、* のあとに ? を記述します。
　もっとも、これをやってもおっしゃったような状況にはならず、

　　1,2345,6789

　になりますが。
　（これは、一度置き換えの対象になった部分は二度と検索しないという規則があるからです）

noname#25358 · Answer

leaz024さんに補足していただいているようですが念のため。

＞長さが一定になるようなパターンなら
　はい。
　実際に試してみました。必ず先頭からです。
　最後に $ を付けたら最後からになるかと思ったんですが、やってみたらやっぱり先頭からでした。
　ですので、正規表現の検索は必ず先頭からってことになるようです。

＞そういう解釈であっていますか？
　これも合ってます。はい。

leaz024 · Answer

最長マッチについては、deagleさんのアドバイスでご理解頂けていると思います。

$num="1234567890"とすると、１回目のマッチングでは「1234567,890」となりますね。
s///は「置換した回数」（この場合1）を返すので、置換が成功するとwhileの条件が真となり、また置換を行おうとします。
この繰り返しで、２回目で「1234,567,890」、３回目で「1,234,567,890」となり、ここでマッチしなくなるためs///が0を返し、whileが終了します。

下記HPが大変参考になりますので、ご一読ください。

参考URL：http://www.din.or.jp/~ohzaki/perl.htm#NumberWithComma

置換演算子についての疑問

えとですね。

この回答への補足

leaz024さんに補足していただいているようですが念のため。

最長マッチについては、deagleさんのアドバイスでご理解頂けていると思います。

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

　えとですね。

　leaz024さんに補足していただいているようですが念のため。