文字列前後の「全角空白/半角空白/改行文字」を取り除く

Question

PHPで、「文字列の前後に付加されている全角空白/半角空白/改行文字を取り除く」
という処理をしたいのですが、以下のように置換処理を書くとうまくいきません。

$after = preg_replace('/^[ 　\r\n]*(.*)[ 　\r\n]*$/u', '$1', $before);
// [ 　\r\n]→[半角空白、全角空白、改行文字]です

どううまくいかないのかといいますと、入力として半角スペース＋全角文字が入ったときに、全角文字の先頭文字が文字化けしてしまいます。

たとえば、
<半角スペース>あああ
をこれにかけると、
<よくわからない文字>ああ
となります。

以下のように2回に分けてみると、正常に動きます。
$tmp = preg_replace('/[ 　\r\n]*$/u', '', $before);
$after = preg_replace('/^[ 　\r\n]*/u', '', $tmp);

最初のように1回の正規表現による置換で済ませたい場合、
どのように書くのが適切なのでしょうか？

PHPのバージョンは5.2.3です。

wp_ · Accepted Answer

preg_replaceはマルチバイトに対応していません。
全角半角は 81 40 なので、それに該当したバイトコード全てを削除しようとします。
「あ」は82 A0なので文字化けはしないと思いますが・・・
「@」（40）が先頭にあったり、81で始まるマルチバイト文字が先頭にある場合は文字化けすると思われます。

正規表現をそのままにmb_ereg_replace()を使うと良いと思われます。

>trim()
マルチバイトでは正常に動かないんじゃないかなぁ。
試してないので分かりませんが。

kuzumiHK · Answer

$after = preg_replace('/^[ 　
]*(.*?)[ 　
]*$/u', '$1', $before);
でも、
$after = mb_ereg_replace('^[ 　
]*(.*?)[ 　
]*$', '\1', $before);
でも、きれいに置換され、
文字化けを再現することはできませんでしたが、
↓preg_replaceでuをつけ忘れたときだけ、「??ああ」となりました。
$after = preg_replace('/^[ 　
]*(.*?)[ 　
]*$/', '$1', $before);
実行環境でuが抜けているということはないでしょうか。

wp_ · Answer

oopsあれー？
と思ったけどよく考えたら当方の環境はEUCだったorz
平にご容赦。そして多謝。

>$after = mb_ereg_replace('^[ 　
]*(.*?)[ 　
]*$', '\1', $before);
これで大丈夫な気はしますけどね。
$afterにunpack()噛ましてみて、??に化けている部分にどんなコードが入っているか確認すると原因が分かるかもしれません。
// 今手元に環境がないゆえ、確認できず

$after = mb_ereg_replace('^[ 　
]*(.*?)[ 　
]*$', '\1', $before);
$after_arr = unpack("C*",$after);
foreach ($after_arr as $char_dec) { echo dechex($char_dec) . " ";}

こうすると$afterの中身がバイナリ形式で分解され、16進数表示されます。
// 今手元に環境がないゆえ、typoあったら容赦
先頭のバイナリが不正でなければ、mb_ereg_replace()ではなく別に原因があることになります。
先頭にゴミが入っていれば、正規表現にもう一工夫する必要があるかと。


/// だれかズバッとした答えを書いてくれないかなぁ(:>^

php504 · Answer

NO3さんtrim( )はだめなようです
私の環境では@も消えちゃいましたよ
PHP5.2.3で文字コードはsjisです
実行結果
　　　　@@@@test@@@@　　　　
test

wp_ · Answer

typoした...orz >全角半角全角空白ですな。罪滅ぼしといってはナンですが、trim()調べました。結論から述べると「いけそうです」 trim()を使うのが手軽で良いかもしれません。 $str = "　　　　@@@@test@@@@　　　　"; // 全角空白あり echo $str."
"; echo trim($str,"　"); ↓ 　　　　@@@@test@@@@　　　　←全角空白がある状態 @@@@test@@@@←trim()を噛んだ状態

HIRSYU · Answer

trimではダメですか？

↓trimの仕様
http://www.php.net/manual/ja/function.trim.php

文字列前後の「全角空白/半角空白/改行文字」を取り除く

preg_replaceはマルチバイトに対応していません。

この回答への補足

$after = preg_replace('/^[ \r\n]*(.*?)[ \r\n]*$/u', '$1', $before);

この回答への補足

oopsあれー？

この回答への補足

NO3さんtrim( )はだめなようです

この回答への補足

typoした...orz

この回答への補足

trimではダメですか？

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

$after = preg_replace('/^[ 　\r\n](.?)[ 　\r\n]*$/u', '$1', $before);