今日の<h1>(.*)</h1>です。正規表現で質問があります。

解決済

質問者：MrYoYoYo
質問日時：2006/04/21 00:14
回答数：4件

mb_ereg("今日の<h1>(.*)</h1>です。",$a,$b)

で、<h1>～</h1>の間の文字をすべて抜き取りたいのですが、
抜き取ってくれません。

抜き取り先のHTMLはUTF-8で記述されていたので、

mb_internal_encodingでUTF-8に
phpにファイルもすべて、UTF-8で記述したのですが、
どうしても抜き取ってくれません。

正規表現に間違いがあるのでしょうか？

何かアドバイスいただけませんでしょうか？

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (4件)

ベストアンサー優先
最新から表示
回答順に表示

No.3ベストアンサー

回答者： BLUEPIXY
回答日時：2006/04/21 12:43

＃２＞このようなエラー文がはきだされませんでしょうか？

でませんでした。

１．まず、以下のような単純なマッチングがうまくいくかテストしてみる。
<?php
$a="今日の<h1>タイトル</h1>です。";
if(mb_ereg("今日の<h1>(.*)</h1>です。",$a,$b)){
print $b[1];
}
?>
２．読込先のＨＴＭＬを読み込んで、単に表示してみる
などして、問題を切り分けるところからやってみてはどうでしょう

- 0
- 件

通報する

No.4

回答者： BLUEPIXY
回答日時：2006/04/21 12:59

>mb_internal_encodingでUTF-8に

>phpにファイルもすべて、UTF-8で記述したのですが、
ということなので、必要ないかもしれませんが
mb_regex_encoding("UTF-8");
も試してみてはどうでしょうか

参考URL：http://jp.php.net/manual/ja/function.mb-regex-en …