重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【終了しました】教えて!goo新規会員登録

お世話になります。

HtmlDocumentで、タグの中のテキストのみを
取得したいのですが、どうもよく解りません。

例)
<div id='a1'>あいうえお
<span id='a2'>かきくけこ
<span id='a3'>さしすせそ
</span>
たちつてと
</span>
なにぬねの
</div>

上記のような例があった場合、idが『a1』のテキストを
取得しようと、メソッドのOuuerTextとInnerTextを呼び出すと、
『あいうえおかきくけこさしすせそたちつてとなにぬねの』と、
その中すべてが帰ってきてしまいます。しかも配列ではなく、
一つの文字列として。

a1で取得した場合、『あいうえお』と『なにぬねの』の
配列変数で取得したいのですが(つまり、ほかのタグで
囲まれているものは走査しないが、区切りとしては見る)、
メソッド一発でできないのでしょうか。

OuterTextとInnerTextの効果の違いもよくわかりません。

コツコツと手作業で行うしかないのでしょうか?

よろしくお願いします。

A 回答 (1件)

ちょっと面倒かもしれませんが、次のサイトにある正規表現の<sentense>に当たるところにご希望の文字列が入ります。



http://www.oborodukiyo.info/RE/VS2010/RE-Pickout …

希望するタグの所を見つけるのがちょっと大変かもしれませんが。

参考になれば。
    • good
    • 0
この回答へのお礼

ありがとうございます。

いろいろ見てみましたが、やはりHtmlDocument自体が
役に立ちそうにありません。

教えていただいた方法で、地道に解析するほうが
正解のようですね。

正規表現は、いろいろ勉強していますが、なかなか
難しいです。

またよろしくお願いいたします。

お礼日時:2013/05/30 10:08

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!