A 回答 (3件)
- 最新から表示
- 回答順に表示
No.3
- 回答日時:
明らかに説明不足ですね。
タイトル?本文?
ブログでも抽出したいのでしょうか?
ブログのXMLファイルを読み込みたいのなら「XMLDOM」というやり方があります。
とりあえず、この質問は破棄して、回答する側の身になって質問文を書き直しましょう。
No.2
- 回答日時:
質問者は、どれぐらい(エクセル)VBAが出来るのか。
その辺を考える必要があるだろう。やることは
(1)WEBページの内容をコンピュター的に知る(捕まえる)
(2)タイトルや、本文を抜き出す(選別する)方法(ロジック)
(3)エクセルシートに書き出し
の内、(3)しかエクセルVBAの範囲ではない。
ーー
他ソフトとの連携などは、すこしぐらいエクセルVBAが出来ても、歯が立たないはず(別物)
インターネットでそのWEBページを表示し、表示ーソースで表示されるような情報が、サーバーから送られてきて、インターネットエクスプローラー(WEBブラウザ)などが、HTML文の約束に従って質問者のパソコンで見えているような文字・画像などに再現して見せている。
(2)のこの中で、タイトルや本文と質問者が言っているものを抜き出すのは一般原理的には不可能だろう。
HTML文には<TITLE>や<BODY>はあるが、これが意味的にタイトルであったり、本文である保証はない。
ーー
判らないからと、丸投げでこういうコーナーにすぐ聞くことはやめて、HTML文の役割などを勉強すること。HTMLはWEBページの体裁(見てくれ)を整えることに重点が置かれている。その点から意味的重要な内容はここだと伝えるには不便で、他のマークアップ言語が工夫されている理由である。こういうことを勉強するのが先だ。
難しいことを他人頼みでやろうとしすぎ。
ーー
ただし、最近WEB記事が充実し、インターネットを起動してWEBページを送らせて、テキスト情報を掴むコードは調べれば直ぐ調べられる。
少し勉強する人ならとっくに注目しているはず。
例えば「VBA インターネット」などで照会して
http://www.ken3.org/cgi-bin/group/vba_ie.asp
や
http://officetanaka.net/other/extra/tips02.htm
などを参考に(後者で)
Sub Sample()
Dim Http, buf As String
Set Http = CreateObject("MSXML2.XMLHTTP")
Http.Open "GET", "http://www.officetanaka.net/other/index.htm", False
Http.Send
buf = StrConv(Http.ResponseBody, vbUnicode)
Open "C:\sample.htm" For Output As #1
For i = 1 To 10
MsgBox Mid(buf, (i - 1) * 600 + 1, 600)
Next i
Close #1
Set Http = Nothing
End Sub
i = 1 To 10の10は手抜きで見本を示すための例です。
上記ForNextの部分を、元のPrint #1, bufにすればテキストファイルに書き出せる。
こういうテキストから本文やタイトルをどうして抜き出すのか、質問者のURLの場合で、その方法(ロジック)を文章でも表現できますか。出来ないだろう。
No.1
- 回答日時:
>URLからタイトルと本文を抽出する
HPアドレスから、ネット上のサイトのタイトルと本文を抽出?
なんとなくやりたい事はわからなくもないが、現実問題難しいのでは?
タイトルに関しては手段が無いわけではない
ページのタイトルはヘッダー情報に記載されているので、タイトルを抽出するためにはヘッダー情報を読み込めれば可能
例:
※TELNETコマンドでページを取り込み、ヘッダー内の<TITLE>タグで囲まれた中身を抽出すれば可能※
本文とは何を意味するかによって手段が大きく異なります
ページによっては、WEBクエリーで目的の箇所だけ読み込む事は可能ですが
ページの作りによってその処理は変わってくるので、全てのサイトに適応する事はほぼ不可能
たとえば
www.yahoo.co.jp
このページの本文ってどこを指しますか?
>本文は、全てではなく、200文字とか
テキストだけで構成されたページであれば可能でしょうが
・はじめにバナー広告が来てたり
・スクリプト処理だけが書かれていて、ページ本体は別の場所に有ったり
こんな場合(ほとんどのサイトはこんな作りですが)何処を読み込むの?
HTML構文に関して一度学習してから質問しなおされた方が良いかと思います
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(データベース) Accessのクエリで1フィールドの抽出条件設定をNullでなく全角半角含む空白のみの文字列でない文 1 2023/04/24 15:20
- WordPress(ワードプレス) Wordpressの記事URLを自由に決めたい 3 2022/06/02 12:05
- Excel(エクセル) エクセルで2つの表を比較して、文字列が同じだが、その行のある値が違うものを抽出したい 1 2022/10/06 21:48
- Excel(エクセル) エクセルで#以降の文字を取得したい 1 2022/03/28 13:14
- Excel(エクセル) エクセル関数について 8 2023/06/28 17:04
- Visual Basic(VBA) SQLで抽出 4 2022/12/04 13:55
- Visual Basic(VBA) Excel VBA 教えてください。 VBA初心者です。 詳しい方がいましたら教えてください。 下記 3 2023/04/25 11:22
- Visual Basic(VBA) Excel VBAでAA(BBB) → BBB.AA に置換したい 2 2022/10/30 13:59
- Excel(エクセル) ExcelVBA メモ帳を起動し名前を付けて指定フォルダに保存 2 2022/04/18 13:15
- Excel(エクセル) capeofdragonと申します Excel2016を使っておりまして 半角又は全角の任意文字列が 2 2022/10/31 13:51
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
パワーポイントで参照ページを...
-
VBAでマルチページのページ指定...
-
UserForm.showでマルチページ1...
-
<IFRAME>でコンテンツ部分のみ...
-
機械学習(決定木学習)のソース...
-
ページの増やしかたを教えてく...
-
ワンクッションページの構造
-
特定のぺージにアクセスしたら...
-
エクセルVBAでマルチページの切...
-
アクティブレポートの、ページ...
-
検索エンジンにインデックスさ...
-
写真で、「クリックすると拡大...
-
IE を開いてページ内のリンクを...
-
検索順位が下がった
-
Gotoを使わずに済みますか?
-
一つのページに動画を複数、軽...
-
単語を少し変えると1位になるの...
-
各ページの1番上の表示について
-
ワードはページ数イコール枚数...
-
地味なページはnofollowにする?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
パワーポイントで参照ページを...
-
各ページの1番上の表示について
-
<IFRAME>でコンテンツ部分のみ...
-
VBAでマルチページのページ指定...
-
エクセルVBAでマルチページの切...
-
UserForm.showでマルチページ1...
-
検索エンジンにインデックスさ...
-
ページの自動ジャンプを止めるには
-
単語を少し変えると1位になるの...
-
アクセス解析。「直前に見てい...
-
検索順位が下がった
-
TEX ページ番号について
-
地味なページはnofollowにする?
-
vbsで開かれた別ウィンドウを制...
-
アクティブレポートの、ページ...
-
Excel2007 VBA で2ページ目PDF
-
リダイレクト前のURLをブックマ...
-
TOMCATを入れたPCのHTMLが別PC...
-
VBAでWEBサーバー上に保存され...
-
アクセス元URLをばれないよ...
おすすめ情報