

VBAでMSHTML.HTMLDocumentを使用してWEB上から指定したタグ内のテキストを取得しようとしているのですが、取得したいデータがタグが複数に分かれています。
divの特定クラス内だけなど取得したいのですが、データ1は<h1>データ2は<td>や<p>など、getElementsByTagName(tag)だと、一つしかタグを指定きず、個別に取得するとデータ1とデータ2の関連がバラバラになってしまう為、複数タグを指定して取得できる方法を探しています。
イメージとしてはgetElementsByTagName(tag).Lengthが10の時にh1のタグを発見してそこからh1のinnerTextとtdタグ2つ分のinnerText取得して、またh1タグを発見するまでループして取得するような形に出来ればと思っています。
自作する以外ないのでしょうか?
No.2ベストアンサー
- 回答日時:
>getElementsByTagName(tag)だと、一つしかタグを指定きず
getElementsByTagName('*')とか?
回答ありがとうございます。
昨日、getElementsByTagName('*')が出来ると言う情報を見て、試してみましたが、あまりに重かったので断念しました。2つや3つぐらい指定できると良いなぁと思っていたら、Selectors APIと言うもので、document.querySelectorAll('span, strong');とすれば取れる事が分かりました。
ただ、仕様が分からずです・・・。
VBAでのサンプルがあれば助かると思いつつ調べ中です。
No.1
- 回答日時:
そうだねぇ 親tagを getElementsByTagName で持ってきて解析 が最も速いだろうね。
ただ、最初の1回をxpath指定をして取り出す方法があるからそれを使うのも有りかな。
速度的には親を持ってきて解析が速いと思うけど・・・
xpathのはなんてメソドだかはちょっと忘れちゃった。調べる時間が無いので参考ってことで。
この回答への補足
回答ありがとうございます。私の説明不足でした、すいません。
(その他htmlが続く)
<h1>エイチ1</h1>
<p>ピー1</p>
<p>ピー2</p>
(その他htmlが続く)
<h1>エイチ2</h1>
<p>ピー3</p>
<p>ピー4</p>
<p>ピー5</p>
(その他htmlが続く)
エイチ1~ピー1までと、エイチ2~ピー5までを取得したいと思っています。
親tagとなるdivなどを発見する度に・・・と言う処理なら
objDiv = doc.getElementsByTagName("div")
objDiv.getElementsByTagName("p").item(i).innerText
と言う感じで取れました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
HTML&CSS 学習本の相談
-
テーブルの行を折りたたみたい...
-
絶対パスと相対パスについて。
-
HTML&CSS 学習方法のお勧め
-
ホームページのサイトでhtm...
-
CSSを教えて下さい webデザイナ...
-
Affinger6でトップページに記事...
-
htmlの文字が縦書きになる
-
ホームページを作っていたらhtm...
-
HTML/CSSを使って写真のような...
-
HTMLでクロス抽出したい
-
静止画画像をクリックすると音...
-
スマホで、左右にスワイプして...
-
メモ帳の段落の揃え方
-
htmlが簡単に作成できるアプリ...
-
Webサイトの「デザインのみ(コ...
-
HTMLで画像をポップアップで表...
-
初心者html・CSS ウィンドウを...
-
WEBページを強制的に横画面で見...
-
iPhoneで HTMLファイルを閲覧
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ユーザーフォームの表示を追加...
-
CGIフォーム、タグの表示につい...
-
HTMLコード内に、コード各部の...
-
HTMLでぶら下げインデントは出...
-
アクセス2000(ADO)のレコード更...
-
ホームページビルダーで作った...
-
アメブロでの行揃えの記述方法
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
パワーポイント:テキストボッ...
-
パワーポイントの見出しの線の...
-
Google Keepで数字に勝手に下線...
-
URLが青くならない
-
outlook2003にて新規メッセージ...
-
アンダースコア(下線)のあるメ...
-
Wordでレイアウトを変えないで...
-
Word で下線の色の変え方
-
HTMLのbody内に<style>~</styl...
-
エクセル:セル内の文字列の下...
-
Latexにおける下線のひき方のコト
おすすめ情報