

VBAでMSHTML.HTMLDocumentを使用してWEB上から指定したタグ内のテキストを取得しようとしているのですが、取得したいデータがタグが複数に分かれています。
divの特定クラス内だけなど取得したいのですが、データ1は<h1>データ2は<td>や<p>など、getElementsByTagName(tag)だと、一つしかタグを指定きず、個別に取得するとデータ1とデータ2の関連がバラバラになってしまう為、複数タグを指定して取得できる方法を探しています。
イメージとしてはgetElementsByTagName(tag).Lengthが10の時にh1のタグを発見してそこからh1のinnerTextとtdタグ2つ分のinnerText取得して、またh1タグを発見するまでループして取得するような形に出来ればと思っています。
自作する以外ないのでしょうか?
No.2ベストアンサー
- 回答日時:
>getElementsByTagName(tag)だと、一つしかタグを指定きず
getElementsByTagName('*')とか?
回答ありがとうございます。
昨日、getElementsByTagName('*')が出来ると言う情報を見て、試してみましたが、あまりに重かったので断念しました。2つや3つぐらい指定できると良いなぁと思っていたら、Selectors APIと言うもので、document.querySelectorAll('span, strong');とすれば取れる事が分かりました。
ただ、仕様が分からずです・・・。
VBAでのサンプルがあれば助かると思いつつ調べ中です。
No.1
- 回答日時:
そうだねぇ 親tagを getElementsByTagName で持ってきて解析 が最も速いだろうね。
ただ、最初の1回をxpath指定をして取り出す方法があるからそれを使うのも有りかな。
速度的には親を持ってきて解析が速いと思うけど・・・
xpathのはなんてメソドだかはちょっと忘れちゃった。調べる時間が無いので参考ってことで。
この回答への補足
回答ありがとうございます。私の説明不足でした、すいません。
(その他htmlが続く)
<h1>エイチ1</h1>
<p>ピー1</p>
<p>ピー2</p>
(その他htmlが続く)
<h1>エイチ2</h1>
<p>ピー3</p>
<p>ピー4</p>
<p>ピー5</p>
(その他htmlが続く)
エイチ1~ピー1までと、エイチ2~ピー5までを取得したいと思っています。
親tagとなるdivなどを発見する度に・・・と言う処理なら
objDiv = doc.getElementsByTagName("div")
objDiv.getElementsByTagName("p").item(i).innerText
と言う感じで取れました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ユーザーフォームの表示を追加...
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
パワーポイントの見出しの線の...
-
パワーポイント:テキストボッ...
-
Google Keepで数字に勝手に下線...
-
アンダースコア(下線)のあるメ...
-
URLが青くならない
-
Word で下線の色の変え方
-
エクセルにテキストボックスを...
-
HTMLのbody内に<style>~</styl...
-
年度の切り替え方法について@...
-
AUTOCAD文字の下に同じ長さの線...
-
テーブルタグで画像を並べて画...
-
Latexにおける下線のひき方のコト
-
Googleアカウントの名前変更出...
-
ExcelのVBAで下線のついている...
-
PPTのもくじ
-
本性は醜いが、それを自覚した...
-
E-mail中の文章に赤で下線を引...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
アメブロでの行揃えの記述方法
-
リスト
-
ユーザーフォームの表示を追加...
-
ホームページビルダーで作った...
-
【EZ】marqueeじゃなくて…
-
(至急!!)ダグって何ですか?
-
bodyとtdのフォントサイズの依...
-
携帯サイトを作っているのです...
-
強制的に、リンクを飛ばすタグ...
-
ドロップダウンメニュー
-
Scratchでクイズのゲーム制作を...
-
HTMLコード内に、コード各部の...
-
アクセス2000(ADO)のレコード更...
-
複数タグ指定してHTMLを取得したい
-
HTMLでぶら下げインデントは出...
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
パワーポイント:テキストボッ...
-
Google Keepで数字に勝手に下線...
-
URLが青くならない
おすすめ情報