VBAでMSHTML.HTMLDocumentを使用してWEB上から指定したタグ内のテキストを取得しようとしているのですが、取得したいデータがタグが複数に分かれています。
divの特定クラス内だけなど取得したいのですが、データ1は<h1>データ2は<td>や<p>など、getElementsByTagName(tag)だと、一つしかタグを指定きず、個別に取得するとデータ1とデータ2の関連がバラバラになってしまう為、複数タグを指定して取得できる方法を探しています。
イメージとしてはgetElementsByTagName(tag).Lengthが10の時にh1のタグを発見してそこからh1のinnerTextとtdタグ2つ分のinnerText取得して、またh1タグを発見するまでループして取得するような形に出来ればと思っています。
自作する以外ないのでしょうか?
No.2ベストアンサー
- 回答日時:
>getElementsByTagName(tag)だと、一つしかタグを指定きず
getElementsByTagName('*')とか?
回答ありがとうございます。
昨日、getElementsByTagName('*')が出来ると言う情報を見て、試してみましたが、あまりに重かったので断念しました。2つや3つぐらい指定できると良いなぁと思っていたら、Selectors APIと言うもので、document.querySelectorAll('span, strong');とすれば取れる事が分かりました。
ただ、仕様が分からずです・・・。
VBAでのサンプルがあれば助かると思いつつ調べ中です。
No.1
- 回答日時:
そうだねぇ 親tagを getElementsByTagName で持ってきて解析 が最も速いだろうね。
ただ、最初の1回をxpath指定をして取り出す方法があるからそれを使うのも有りかな。
速度的には親を持ってきて解析が速いと思うけど・・・
xpathのはなんてメソドだかはちょっと忘れちゃった。調べる時間が無いので参考ってことで。
この回答への補足
回答ありがとうございます。私の説明不足でした、すいません。
(その他htmlが続く)
<h1>エイチ1</h1>
<p>ピー1</p>
<p>ピー2</p>
(その他htmlが続く)
<h1>エイチ2</h1>
<p>ピー3</p>
<p>ピー4</p>
<p>ピー5</p>
(その他htmlが続く)
エイチ1~ピー1までと、エイチ2~ピー5までを取得したいと思っています。
親tagとなるdivなどを発見する度に・・・と言う処理なら
objDiv = doc.getElementsByTagName("div")
objDiv.getElementsByTagName("p").item(i).innerText
と言う感じで取れました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(学校・勉強) この中で間違ってある説明はありますか?詳しい方に教えていただきたいです。 A. 1つのプログラムが複 2 2023/07/14 01:15
- HTML・CSS 【CSS】特定のリンクを含むaタグを指定できるかどうか? 3 2022/10/15 02:45
- PostgreSQL 列が存在しないと言われる 2 2023/02/10 18:33
- HTML・CSS 自身のHPにYouTube動画を貼り付けるのが出来なくなり困ってます 1 2022/11/11 10:44
- その他(プログラミング・Web制作) python 気象データの取得 2 2023/06/20 23:54
- その他(プログラミング・Web制作) Windowsのマクロプログラムで、こんなことできますか? 3 2022/06/28 14:30
- 写真・ビデオ 写真や動画を保存する、これらを満たしたサービスはありませんか。 ・iOS, Android, Mac 2 2023/07/30 18:35
- Instagram どう思いますか? 以前、旦那が私と結婚した時の指輪や婚姻届が付いている写真をインスタにあげたんです。 2 2022/07/14 21:05
- その他(Microsoft Office) マクロVBAについて 1 2022/09/06 18:12
- HTML・CSS HTMLタグのあるCSVファイルを利用する方法 4 2023/03/19 14:41
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
HTMLでぶら下げインデントは出...
-
省略できるHTMLについて
-
HTMLで、2行目以降をほぼ1字下...
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
URLが青くならない
-
Google Keepで数字に勝手に下線...
-
アンダースコア(下線)のあるメ...
-
パワーポイント:テキストボッ...
-
Word で下線の色の変え方
-
Wordでレイアウトを変えないで...
-
EXCEL2003 Webページとして保存...
-
フランス語の質問です。 J'aime...
-
HTMLのbody内に<style>~</styl...
-
PivotTableのデータソースを一...
-
エクセルにテキストボックスを...
-
ブログランキングのバナーを2...
-
高校英語 語法 わかりません!
-
【excelの下線(会計)とは】
-
Latexにおける下線のひき方のコト
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
HTMLコード内に、コード各部の...
-
HTMLで、2行目以降をほぼ1字下...
-
ユーザーフォームの表示を追加...
-
リストマークの位置がずれてい...
-
アクセス2000(ADO)のレコード更...
-
面白いタグ
-
ホームページの文字点灯
-
gaiax系ページでの背景の固定
-
bodyとtdのフォントサイズの依...
-
アメブロでの行揃えの記述方法
-
HTMLでぶら下げインデントは出...
-
歌詞のコピーライトについて
-
複数タグ指定してHTMLを取得したい
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
パワーポイント:テキストボッ...
-
URLが青くならない
-
Google Keepで数字に勝手に下線...
-
エクセル:セル内の文字列の下...
-
AppleのNumbersというアプリで...
おすすめ情報