HTMLのデータ読み取り
下記のように記述されたホームページの一部からデータを読み取りしたいのですが
いろいろ参考にしてプログラムしても構文エラーで実行できません。
WEBBROUSERを使用してHTML.DOCUMENTを取得するところまではできました。
すみませんが詳しい方教えていただけますでしょうか?
VB2010を使用し、document.completeイベントにて取得しようとしています。
---------------------
<dl class="clearfix" style="padding:10px 0 0;">
<dt>現在位置 :</dt>
<dd class="address">
<span class="address-now">+38</span><br /><span class="vat">(mm)</span>
</dd>
<dt>目標 :</dt>
<dd class="target"><span class="user-target">読み込み中</span></dd>
</dl>
---------------------
ほしい出力
text1.text = address
text2.text = +38
text3.text = target
text4.text = 読み込み中 ← この値は変化しています
よろしくお願いします。
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.3
- 回答日時:
#2 の続きです。
【方法1】の文字の切り分けは、#1 さんがお書きのような「正規表現」の方が スマート なのかも知れません。
--------------------------------
'【方法1】className = "clearfix" の Element の innerHTML から、切り分けていく方法
searchClass = "clearfix"
If UBound(getElementsByClass(searchClass)) = 0 Then
myStr = getElementsByClass(searchClass)(0).innerHTML
myStr = Right(myStr, Len(myStr) - InStr(myStr, "class") - 5)
myMsg = "text1.text = " & Left(myStr, InStr(myStr, "><SPAN class=") - 1)
myStr = Right(myStr, Len(myStr) - InStr(myStr, "class") - 5)
myMsg = myMsg & vbNewLine & "text2.text = " & Mid(myStr, InStr(myStr, ">") + 1, InStr(myStr, "<") - InStr(myStr, ">") - 1)
myStr = Mid(myStr, InStr(myStr, "class") + 5)
myStr = Right(myStr, Len(myStr) - InStr(myStr, "class") - 5)
myMsg = myMsg & vbNewLine & "text3.text = " & Left(myStr, InStr(myStr, "><SPAN class=") - 1)
myStr = Mid(myStr, InStr(myStr, "class") + 5)
myMsg = myMsg & vbNewLine & "text4.text = " & Mid(myStr, InStr(myStr, ">") + 1, InStr(myStr, "<") - InStr(myStr, ">") - 1)
MsgBox myMsg
Else
MsgBox "className = """ & searchClass & """ の Element が複数存在します。"
End If
--------------------------------
'【方法2】"text1.text"・"text3.text" は決め打ち、その他は <span> タグ 内の outerText から取得
myMsg = "text1.text = address"
searchClass = "address-now"
If UBound(getElementsByClass(searchClass)) = 0 Then
myMsg = myMsg & vbNewLine & "text2.text = " & getElementsByClass(searchClass)(0).outerText
End If
myMsg = myMsg & vbNewLine & "text3.text = target"
searchClass = "user-target"
If UBound(getElementsByClass(searchClass)) = 0 Then
myMsg = myMsg & vbNewLine & "text4.text = " & getElementsByClass(searchClass)(0).outerText
End If
MsgBox myMsg
No.2
- 回答日時:
>VB2010を使用し
私は、VB は解りませんが、回答が付かないようですので、ご参考までにご覧ください。(私の場合は、WSH や VBA で、よく同様の作業をしております)。
#回答を書いている内に、回答が付いたようですが、せっかく書いたので、恥ずかしながら投稿いたします。
#全くの見当違いな回答でしたら、お見捨てください。
--------------------------------
>下記のように記述されたホームページの一部から
とのことですが、お示しの html コード だけでは、この中から、
>データを読み取りし
ご要望の text を取得しようとすると、その「ホームページ」の全ての html コード の中から「<dl class= ~~」などの位置を取得して、それ以降の文字列を「文字列操作関数」で切り分けていくような段取りになるかと存じます。
--------------------------------
お示しの html コード が「name = "~~"」とか「id = "~~"」などを内包する タグ を親要素として持っている場合でしたら、
>「ホームページ」の全ての html コード
ではなくて、[GetElementByName メソッド] や [GetElementById メソッド] で、その innerHTML に内容を絞り込むことはできます。
--------------------------------
あるいは、
http://blog.livedoor.jp/nipotan/archives/1542469 …
をご参考に、「getElementsByClass()」でも実装させて、「className="address-now"」・「className="user-target"」の <span> タグ の outerText を取得する方法になりましょうか。。。
--------------------------------
ちなみに、
text1.text = address
text3.text = target
の2行につきましては、199Xnen さんの決め打ちでしたら、「取得する」のではなくて、端から
text1.text = "address"
text3.text = "target"
のように指定すればよいだけのように存じますが。。。
--------------------------------
'これ以下は、Excel VBA での一例です。ご参考までにご覧ください。
Option Explicit
Dim objIE As Object 'IWebBrowser2
Sub Macro()
Dim searchClass As String
Dim myStr As String
Dim myMsg As String
Set objIE = CreateObject("InternetExplorer.Application")
With objIE
.Visible = True
.navigate "下記のように記述されたホームページのURL"
While .Busy Or .ReadyState <> 4: DoEvents: Wend
'●● ここに【方法1】または【方法2】の コード を挿入
End With
objIE.Quit
Set objIE = Nothing
End Sub
Function getElementsByClass(searchClass)
Dim allElements As Object 'DispHTMLElementCollection
Dim i As Long
Dim j As Integer
Dim classElements() As Object
Set allElements = objIE.document.getElementsByTagName("*")
For i = 0 To allElements.Length - 1
If allElements(i).className = searchClass Then
ReDim Preserve classElements(j)
Set classElements(j) = allElements(i)
j = j + 1
End If
Next i
getElementsByClass = classElements
End Function
丁寧にありがとうございます。
今のところ、VBAをVB2010に変換するのもうまくできない
初心者なのですが、参考にさせていただき、がんばってみようと思います。
ありがとうございました。
No.1
- 回答日時:
もし、必ず同じ場所にテキストが表示されるのなら、Mid関数で取りに行く。
絶えず変化する若しくはHTML出力される文字列が多い場合は、正規表現がよいのでは?
例
ddタグの列挙
Dim r As New System.Text.RegularExpressions.Regex( _
"<(dd\b[^>]*>(.*?)</\1>", _
System.Text.RegularExpressions.RegexOptions.IgnoreCase Or _
System.Text.RegularExpressions.RegexOptions.Singleline)
'HTML.DOCUMENT内で正規表現と一致する対象をすべて検索
Dim mc As System.Text.RegularExpressions.MatchCollection = _
r.Matches(HTML.DOCUMENT)
For Each m As System.Text.RegularExpressions.Match In mc
'正規表現に一致したグループの文字列を表示
Console.WriteLine("タグ:" + m.Groups(1).Value + vbCrLf + _
"タグ内の文字列:" + m.Groups(2).Value)
Next
参考URL:http://dobon.net/vb/dotnet/string/regexmatch.html
正規表現というキーワードはググっているうちに何度か目撃し、
この方法か、Webbrouserの解析結果を
取得するかと感じていました。しかし、ちょっと敷居が高いと感じていたもので。
参考にさせていただき、じっくり読み解いてみたいと思います。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- HTML・CSS FC2カートのテンプレートでの商品表示について 1 2023/03/02 18:05
- JavaScript jqueryを使ったスムーススクロールのコードを書いたのですが、HTMLコード内にある、a butt 2 2022/04/14 10:59
- HTML・CSS アコーディオンメニューが思うように動作しません。 1 2023/08/20 16:48
- JavaScript htmlとcssで分数を表示後、分数の右側に文書を書きたい 1 2022/04/28 10:09
- HTML・CSS 分数が正常に表示されない。 6 2022/05/09 18:53
- HTML・CSS ヘッダーの画像にメインエリアがかぶってしまいます 1 2022/11/28 14:06
- HTML・CSS CSS のみのタブ切り替えについて 1 2023/01/11 16:47
- PHP PHP MySql 画像を取得 1 2022/06/04 14:05
- その他(プログラミング・Web制作) pythonのWebスクレイピングでfind_allだとurlがNoneに 4 2022/04/17 18:21
- HTML・CSS CSSのホバーエフェクト 1 2023/06/19 06:53
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
vba 日本語以外を抽出について
-
テキストボックスかラベル上の...
-
ExcelのVBAで文章にある複数の...
-
[VB6] SQLの作成について
-
VBScript、ClipboardDataオブジ...
-
他のフォームから別のフォーム...
-
VBAで入力数値について
-
エクセルVBAでテキストボッ...
-
Functionの戻り値を配列にした...
-
C言語のサフィックスについて
-
VB.NETでのイベントの途中終了
-
VB6のFriendについて
-
チェックボックスを操作できな...
-
アクセスできない保護レベルエ...
-
maximaについて
-
VBAでcallで呼び出したsubを終...
-
C#のループでtextboxに値を入れ...
-
ピッ、ってアルファベットでど...
-
Excel VBAでsub,dimは何の略?
-
VB6.0の正規表現を使って、文字...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
テキストボックスかラベル上の...
-
ExcelのVBAで文章にある複数の...
-
vba 日本語以外を抽出について
-
Visual Basicについてお聞きし...
-
【VBS】クリップボード操作につ...
-
DTPicker テキストクリアの方法
-
[VB6] SQLの作成について
-
RichTextBoxで指定行の色を自動...
-
perlによるxmlファイルの取得
-
vc++のAPI(dll)の引数をVBAでう...
-
フォルダに名前をつけるバッチ...
-
VB.NET コンボボックスからのit...
-
CASL2 命令の2語と3語の違い
-
文字列を配列に…。
-
助けてください!
-
フォーム、サブフォーム間のデ...
-
文字列を日付型情報として計算...
-
WORd VBA 文章を単語に分解する
-
sublimit textっていうエディタ...
-
VBスクリプトでファイルのコピ...
おすすめ情報