エクセルVBAのマクロを用いてテキスト(ソースコード)よりURLを取得したいと考えています。
<a href="**"> 左記の「**」を取得し、エクセル上に
一覧として出力するものを想定しています。
なお、ソース上にhrefのコードは複数存在するので、
それら全てを出力したいのです。
以下が出力希望例になります。
<a href="http://www.test.co.jp">
<script type="text/javascript">
<a href="http://www.test2.co.jp">
出力結果
http://www.test.co.jp
http://www.test2.co.jp
諸事情があり、テキストを読み込んでエクセル上に取得する形式でお願いしたいです。
すみませんが、よろしくお願いします。
No.1ベストアンサー
- 回答日時:
正規表現を使って、一致する部分を収集します。
Function GetURL(ByVal HTML As String) As Variant
Dim 正規表現
Dim 一致集合_href用
Dim 一致要素_href用
Dim 一致集合_引用符
Dim 一致要素_引用符
Dim 部分列 As String
Dim 引用符 As String
Dim 位置 As Long
Dim 要素数 As Long
ReDim URL(0) As String
要素数 = -1
Set 正規表現 = CreateObject("VBScript.RegExp")
正規表現.Global = True
正規表現.IgnoreCase = True
正規表現.Pattern = "<.*\s+href\s*=\s*"
Set 一致集合_href用 = 正規表現.Execute(HTML)
正規表現.Global = False
For Each 一致要素_href用 In 一致集合_href用
位置 = 一致要素_href用.FirstIndex + 一致要素_href用.Length
部分列 = Mid(HTML, 位置 + 1)
引用符 = Left(部分列, 1)
Select Case 引用符
Case """"
正規表現.Pattern = "\"""
部分列 = Mid(部分列, 2)
Case "'"
正規表現.Pattern = "'"
部分列 = Mid(部分列, 2)
Case Else
正規表現.Pattern = "[\s>]"
End Select
Set 一致集合_引用符 = 正規表現.Execute(部分列)
For Each 一致要素_引用符 In 一致集合_引用符
要素数 = 要素数 + 1
ReDim Preserve URL(要素数)
URL(要素数) = Left(部分列, 一致要素_引用符.FirstIndex)
Exit For
Next
Next
If 要素数 >= 0 Then GetURL = URL
End Function
呼び出しサンプル
Dim T$, A, B, C&
T = "<a href = ""http://www.test.co.jp"">" & vbNewLine _
& "<script type=""text/javascript"">" & vbNewLine _
& "<a href='http://www.test2.co.jp'>" & vbNewLine _
& "<script type=""text/javascript"">" & vbNewLine _
& "<a href= http://www.test3.co.jp >"
A = GetURL(T)
If IsEmpty(A) Then
MsgBox ("URLなし")
Else
For Each B In A
C = C + 1
Cells(C, 1) = B
Next
End If
正規表現オブジェクト、構文については以下を参照
http://msdn.microsoft.com/ja-jp/library/cc392403 …
http://msdn.microsoft.com/ja-jp/library/cc392020 …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- JavaScript jqueryを使ったスムーススクロールのコードを書いたのですが、HTMLコード内にある、a butt 2 2022/04/14 10:59
- SEO googleサーチコンソールで、重複URLが多数発生、その修正方法について 2 2023/06/23 16:15
- PHP if(preg_match("/[^0-9]/",$gu_d)){意味を教えてください。 1 2022/05/06 05:37
- Excel(エクセル) Powershell エクセル検索 完全一致の方法 1 2022/06/05 20:19
- PHP アコーディオンPHPが上手くいかない 3 2022/07/15 16:29
- Excel(エクセル) エクセルVBAで図形のテキストを取得してセルに入力 2 2022/10/05 23:09
- Access(アクセス) Accessのクエリの結果を、既存のエクセルに追加したい 2 2022/07/31 22:44
- Visual Basic(VBA) VBAで出力したCSVファイルの先頭にカンマを挿入したい 5 2022/10/14 12:20
- Excel(エクセル) エクセルでcsvファイルを開いてVBAを使いたい 7 2022/04/28 11:12
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
【ヒトの神秘】美男美女から何...
-
超音波で洗脳。
-
CSS:overflow要素の印刷について
-
input type="hidden"で取得した...
-
タグは大文字と小文字どちらが...
-
マージソートの計算量について-...
-
「諸要素」とはどういう意味で...
-
質問1.
-
含む含まないという概念自体の...
-
テキストボックスの中にリンク...
-
NからZへの全単射を具体的に構...
-
メールアドレス(グループ)の...
-
C言語線形リストの問題です
-
Bootstrap レスポンシブ textarea
-
エクセルVBAにてURLの抽出
-
エクセルでグラフにマークを入...
-
textareaの幅を画面と合わせたい
-
レスポンシブサイトで、右側に...
-
初歩的な質問です。<div>のwidt...
-
IEと他ブラウザでの行間について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
【ヒトの神秘】美男美女から何...
-
smallにtext-allignが効かない
-
含む含まないという概念自体の...
-
還暦を過ぎた方々に質問です。
-
「諸要素」とはどういう意味で...
-
質問1.
-
textareaの幅を画面と合わせたい
-
角丸画像の背景色を透明にした...
-
2個のFormを横並びにしたい
-
テキストボックスの中にリンク...
-
HTMLです 四角みたいにして中に...
-
CSS:overflow要素の印刷について
-
input type="hidden"で取得した...
-
tdに対してmin-heightの定義、...
-
HTMLページ上でiframeを最前面...
-
タグは大文字と小文字どちらが...
-
HTMLです
-
2行にしたい要素、改行か分割...
-
改行ほどは行かないけど、若干...
-
H1タグを画像にしたい
おすすめ情報