A 回答 (3件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
★追記。
・InternetReadFile() API関数を利用するには
(1)『wininet.h』ヘッダをインクルードします。
(2)『WinInet.Lib』ライブラリをインポートします。
※windows.h をインクルードしていれば wininet.h はインクルードしなくても良い。
・以上。
参考URL:http://msdn2.microsoft.com/En-US/library/aa38547 …
No.1
- 回答日時:
★アドバイス
・InternetReadFile() API関数で HTML ソースを取得できます。
この関数の使用例は次の過去質問を参考にして下さい。
http://oshiete1.goo.ne.jp/qa2630445.html→『InternetReadFileで大きいファイルが読み取れない』
↑
ここに載せています。→回答者 No.2、No.3 を参考に。
・なお、ファイルへ保存しなくてもメモリ内に HTML ソースを取得してメモリ上で URL アドレスを
抽出するようにしても良いでしょう。ただし、巨大な HTML ソース(1MB以上)の場合は別の方法で
分割取得します。このときは一時ファイルに保存して、そのファイルを処理するなどして下さい。
その他:
・前回の質問『URL抽出』→http://oshiete1.goo.ne.jp/qa3097203.html
の補足アドバイスをします。
・HTML ソースの中には改行が全くないタイプが存在するため、前回紹介した簡単なサンプルでは
一部、正常に URL を抽出できません。このタイプにも対応するには HTML ソースからタグを
きちんと解読する必要があります。解読といっても文字列の処理ですので『<』~『>』文字の
間がタグの記述だと判断して『A』→『HREF=』文字列を StrStrI() 関数で見つけます。
その後に『=』文字に続く文字列が URL アドレスなのでダブルクォーテーションなどの文字まで
を抽出します。
・なお、StrStrI() 関数は C言語の strstr() と似た関数ですが、大文字と小文字を区別無く検索
できる便利な関数です。この API 関数を利用するには
(1)#include <shlwapi.h> をインクルードする
(2)shlwapi.lib をインポートする
↑
これで使用できます。
StrStrI() 関数については→http://nienie.com/~masapico/api_StrStrI.html を参考に。
・まずは HTML ソースを一時ファイルに保存して、そのファイルから URL アドレスを抽出してみて下さい。
・以上。
参考URL:http://oshiete1.goo.ne.jp/qa2630445.html
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
時間ごとにリンク先を変更させたい
-
webbrowserでのjavascriptを含...
-
「INT86(・・・・・・);」 っ...
-
VB詳しい方
-
ポップアップを1日1回だけ表示...
-
c言語の改修されたソースから改...
-
JSPの実行結果をHTMLに変換
-
Dreamweaverのコードカラーが黒...
-
ソースの追加行数と変更行数
-
レストラン、英語のメニュー表記
-
htmlのタブの色変更について
-
【VC++6.0(MFC)】Access Violat...
-
画像と文字が重なって表示される。
-
VBAで#Regionに変わるものは無...
-
「MicrosoftVisualBasic6.0 行...
-
#ifdef多用でソースが見づらい
-
IEでテキストの文字が一部だけ...
-
プログラム時のヘッダコメント...
-
先に質問した画像が不鮮明の為 ...
-
実行オブジェクトからソースを...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
htmlソース文の 各行 改行位置...
-
VBAで#Regionに変わるものは無...
-
レストラン、英語のメニュー表記
-
Dreamweaverのコードカラーが黒...
-
プログラム時のヘッダコメント...
-
【VC++6.0(MFC)】Access Violat...
-
#ifdef多用でソースが見づらい
-
ソースの追加行数と変更行数
-
ソースの表示を無効にする方法。
-
画像と文字が重なって表示される。
-
JSPの実行結果をHTMLに変換
-
Visual Source Safe?
-
コメントが閉じてないというエ...
-
HTMLソースの文字コードがutfの...
-
ポップアップを1日1回だけ表示...
-
c言語の改修されたソースから改...
-
「MicrosoftVisualBasic6.0 行...
-
htmlのタブの色変更について
-
DreamWeaver 文字列を含まない...
-
IEでテキストの文字が一部だけ...
おすすめ情報