VBで正規表現
下記のような文字列がTextBoxに入力されています。
<a></a>で囲まれた部分の抽出は出来ましたが、
<td></td>タグで囲まれた’18’も取り出したいのですが正規表現ではどの様に記述すれば宜しいでしょうか?
関係有りそうなコードはこれです。
Regex("<a href=""(?<url>.*?)"".*?>(?<text>.*?)</a>"
----------------------------------------
<TR bgcolor=#ffffff>
<TD> 18 </TD>
<TD><a href="main.py?qtype=userpage&teamnum=162&username=KOTOKO"> KOTOKO </a> </TD>
<TD><a href="http://fah-web2.stanford.edu/awards/cert.php?u=K … target="_blank"> 11379753 </a> </TD>
<TD><a href="http://fah-web2.stanford.edu/awards/cert.php?u=K … target="_blank"> 16190 </a> </TD>
</TR>
----------------------------------------
No.2ベストアンサー
- 回答日時:
No1です。
KOTOKOが見つかればいいのかはわからなかったので、
取り合えず全部を抜き出すもの。
Imports System.Text.RegularExpressions ' 正規表現
Public Class Form1
Dim url As String
Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Load
url = "http://fah-web.stanford.edu/cgi-bin/main.py?qtyp …
WebBrowser1.ScriptErrorsSuppressed = True
WebBrowser1.Navigate(url)
End Sub
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
Dim re As Regex = New Regex("(?<Rank>\d+)\s+(?<Donor>.+?)\s+(?<Score>\d+?)\s+(?<WU>\d+)\s", RegexOptions.Singleline)
Dim st As String = ""
Dim ch As Boolean = False
For Each tg As HtmlElement In WebBrowser1.Document.GetElementsByTagName("TR")
st = tg.InnerText
If Not st Is Nothing AndAlso st.StartsWith("1") Then ch = True
If ch Then
Dim m As Match = re.Match(st)
Debug.Print(m.Result("${Rank}") & vbTab & m.Result("${Donor}") & vbTab & m.Result("${Score}") & vbTab & m.Result("${WU}"))
End If
Next
End Sub
End Class
一例になれば。
No.1
- 回答日時:
Regex("TD>\s(?<no>[^>]+?)</TD|<a href=""(?<url>.*?)"".*?>(?<text>.*?)</a>"
とか?
この回答への補足
試してみましたが上手く動きません。
全コードを書きます。
Public Class Form1
Dim url As String
Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) Handles Me.Load
url = "http://fah-web.stanford.edu/cgi-bin/main.py?qtyp …
WebBrowser1.ScriptErrorsSuppressed = True
WebBrowser1.Navigate(url)
End Sub
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
Form2.Show()
Form2.TextBox1.Text = WebBrowser1.Document.Body.OuterHtml
Dim a As String
Dim s1 As String = Form2.TextBox1.Text
Form2.TextBox1.Select(s1.IndexOf("KOTOKO ") - 87, 370)
a = Form2.TextBox1.SelectedText
'Dim rr As New System.Text.RegularExpressions.Regex("<a href=""(?<url>.*?)"".*?>(?<text>.*?)</a>", System.Text.RegularExpressions.RegexOptions.IgnoreCase Or System.Text.RegularExpressions.RegexOptions.Singleline)
Dim rr As New System.Text.RegularExpressions.Regex("TD>\s(?<no>[^>]+?)</TD|<a href=""(?<url>.*?)"".*?>(?<text>.*?)</a>", System.Text.RegularExpressions.RegexOptions.IgnoreCase Or System.Text.RegularExpressions.RegexOptions.Singleline)
'TextBox1.Text内で正規表現と一致する対象をすべて検索
Dim mcc As System.Text.RegularExpressions.MatchCollection = rr.Matches(a)
For Each mm As System.Text.RegularExpressions.Match In mcc
'正規表現に一致したグループの文字列を表示
MsgBox("タグ:" + mm.Groups(1).Value + vbCrLf + "タグ内の文字列:" + mm.Groups(2).Value)
Next
End Sub
End Class
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Visual Basic(VBA) Selenium.ChromeDriverの使い方について 7 2022/09/22 06:43
- JavaScript EasyUIのSubGrid(jquery)におけるObjectに入れた連想配列について 1 2022/05/02 11:21
- HTML・CSS テーブルタグのセルの幅の一部だけを指定 1 2023/03/12 12:02
- AJAX JavascriptからPHPへのAjax通信でnullが返ってくる 3 2022/08/03 22:00
- HTML・CSS 【CSS】:hasで可能? imgを含むtr要素を選択したい 1 2022/11/17 14:36
- JavaScript jQueryで同じクラス名のものを別物として扱いたい 1 2022/06/17 14:14
- MySQL SQL任意に並び替えをしたい 2 2023/08/28 10:47
- SEO googleサーチコンソールで、重複URLが多数発生、その修正方法について 2 2023/06/23 16:15
- 工学 【制御工学】単位ステップ応答の遅れ時間の求め方(令和2年度の機械設計技術者試験(制御工学)の問題) 3 2022/11/02 10:51
- HTML・CSS 自身のHPにYouTube動画を貼り付けるのが出来なくなり困ってます 1 2022/11/11 10:44
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
<a href="#" …>の意味を教えて...
-
相対パスと絶対パスの速度
-
個別にハイパーリンクの色を指...
-
<a href>での背景色について。
-
POSTで<a hrefを送る方法について
-
正規表現 教えてください
-
下線(アンカー)の表示を特定...
-
ステータスバーにリンクのURLを...
-
数秒後に自動的に移動します。...
-
bodyにidをつける理由は何ですか?
-
別ファイルのfunctionの読み込み方
-
(Javascript)印刷するファイル...
-
複数のJavascriptを1つのscrip...
-
base64encodeでの文字化けについて
-
入力したテキストボックスのデ...
-
ウインドウの後ろに隠れている...
-
JavaScriptでiframeの内容を「...
-
ウインドウを縮小しても文字を...
-
Cygwinでログをのこす方法
-
jQueryでdivをクリックし別窓で...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
<a href="#" …>の意味を教えて...
-
html メールリンクにて自動ファ...
-
相対パスと絶対パスの速度
-
フレームだけ閉じる方法ありま...
-
リンクに飛ばない・・・
-
pythonのWebスクレイピングでfi...
-
HTMLソースからURLだけを抜き出...
-
時間によってリンク先を変える...
-
個別にハイパーリンクの色を指...
-
<a href>での背景色について。
-
mailto + 変数名
-
プルダウンメニューからリンク...
-
POSTで<a hrefを送る方法について
-
chromeでの擬似クラス:focus に...
-
URLでEXEを呼出した際の、引数...
-
同意を求めて、次のページに進...
-
リンクを選択すると現れる点線枠
-
HTML内に記載された画像のURLを...
-
ある一定時間操作していない場...
-
iPadのロングタップ(長押し)...
おすすめ情報