JavaScript にて、正規表現を使って文字列取得を行っております。例えば、 ---------- ※ テキストテキスト ---------- こうであった場合、 /^ ([\s\S]*)\/p>$/ このような形で取得してみたのですが、これだと仮に ---------- ※ テキストテキストここは取得しない。 ---------- このような文章のパターンの場合、 ---------- ここは取得しない。 ---------- ここの部分まで取得してきてしまいます。（後続に p 要素が続く限り全て取得してきてしまう。）これを最初の p 要素の閉じタグまでとしたいです。何か方法ありますでしょうか。ご教授お願い致します。

最短マッチ var reg=new RegExp(" .*? ","g"); var mystr=" ※ テキストテキスト \n ここは取得しない。 "; document.write(mystr.match(reg)[0]);

うーん・・・

[JavaScript] 正規表現による複数要素取得について

解決済

質問者：pikarin774
質問日時：2016/05/10 15:14
回答数：2件

JavaScript にて、正規表現を使って文字列取得を行っております。

例えば、
----------
※ テキストテキスト
----------

こうであった場合、
/^([\s\S]*)\/p>$/
このような形で取得してみたのですが、
これだと仮に

----------
※ テキストテキスト
ここは取得しない。
----------

このような文章のパターンの場合、

----------
ここは取得しない。
----------
ここの部分まで取得してきてしまいます。（後続に p 要素が続く限り全て取得してきてしまう。）

これを最初の p 要素の閉じタグまでとしたいです。
何か方法ありますでしょうか。
ご教授お願い致します。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： Ogre7077
回答日時：2016/05/10 16:02

この手の処理を行うならば、HTML解析した後で DOM や XPath を使うことをお勧めします。

そうすればつまらない問題に悩まされることも無く、間違いの無い処理ができるでしょう。

が、多少の間違いには目をつぶっても、正規表現で簡単に行いたいならば、
単語区切りの \b と、最短一致数量子 *? を使えば、まずまずの結果が得られると思います。

var re = /<p\b.*?>.*?<span\b.*?>(.*?)<\/span\b.*?>(.*?)<\/p\b.*?>/g;
var m = re.exec(文字列);
if (m) 結果表示(m[1] + ' ' + m[2]);

- 0
- 件

通報する

この回答へのお礼

すみません、お返事遅れました。
ご回答ありがとうございます！

やはり正規表現でテキスト置換していくのではなく、
DOM 操作である程度のところまでもっていくのが良いですよね。。。

手法としてどちらにしようか迷っていて、ただの String データを正規表現置換でさくっと処理できればそちらでいいかなと思ったのですが、
やってみると予想外に躓いてしまいました。。

回答いただいた正規表現を参考にしつつ、改めて DOM 操作の方向でも検討したいと思います。
ありがとうございました！

通報する

お礼日時：2016/05/11 11:08