プロが教える店舗&オフィスのセキュリティ対策術

例えば、
SLEEP AND ASLEEPの文字列から
SLEEPを検索し、.zZに変換したいと思います。
しかし、ASLEEPにはHITして欲しくありません。

正規表現でSLEEPだけマッチングさせるには、
どのような式を与えたら良いでしょうか?

そのまま置換に使用したいので、
取得結果としては、オフセット(0,5)が取得できて欲しいです。

正規表現には、POSIXのregexを使用します。

A 回答 (2件)

\bSLEEP\b



http://www.regular-expressions.info/wordboundari …
によると、\bが単語の区切りにマッチするとのこと
    • good
    • 0
この回答へのお礼

早速回答ありがとうございます。
こういうのがあるんですね。試してみたいと思います。

※日本語の場合は難しいでしょうかね?
 「眠と睡眠」から「眠」だけを抽出とか。

お礼日時:2010/03/07 23:32

日本語は難しいです。


英文みたいな明確な単語区切り(空白とか)が無いですし。
日本語の一文字が正規表現で一文字として対応しているかどうか、もちょっとわかりません。

正確にやろうとしたら、自然言語解析で単語に分解して、各単語毎に調べる、ということになるでしょうか。
解析エンジンの性能次第で全く使いものにならない場合も。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!