現在、インターネット上の某有名ショッピングモールに出店しております。
商品一覧ページを作ろうと思いましたが・・・
商品ページのURL回収が厄介です。。
ページのURLは、任意のものではなく、
システム上で自動的につけられたものです。
現在、商品数(ページ数)が2000以上あり、
1ページ1ページを、回収していくのは、困難に近い・・・。
そこで、URLを自動収集してくれるようなフリーソフトがないか・・・と思い探しています。
回収したいのは、URLとページのタイトルです。
よろしくお願いします。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
URLがどのように配置されているのかがわからないので単なるサンプルですが、
指定されてURLからタイトルとそのページにリンクが作られているURLのリンクを取り出すという動作をします。
GetTitle.vbs
------------------------------------------------------------
Dim IE, title, linkNum, i, address, linkText
Set IE = WScript.CreateObject("InternetExplorer.Application")
IE.Navigate ("http://okwave.jp/kotaeru.php3?q=1763489")
While IE.busy: Wend
While IE.Document.readyState <> "complete": Wend
title=IE.Document.title
WScript.Echo title
linkNum = IE.Document.links.length
For i = 0 to linkNum -1
address=IE.Document.links(i).href
linkText=IE.Document.links(i).innerText
WScript.Echo "<a href=""" & address & """>" & linkText & "</a>"
Next
IE.quit
--------------------------------------------------------------
上記は、この質問ページのタイトルとリンク(URL)を抜き出します
適当なファイル名を付けて、
コマンドプロンプトから
>CScript //nologo GetTitle.vbs
って感じで起動します。
結果を適当なファイルに保存するには
>CScript //nologo GetTitle.vbs >list.txt
とかするとlist.txtに保存されます。
大元のURLからたどるとかというのは、ループにしたりすればいいかと思いますが、質問者のページがどういう構成になっていてどういう風に抜き出したいかというのがわからないので、これ以上の動作を要求される場合には、もっと詳しい情報が必要で、一般的には、ムリかと・
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) パイソンでのプログラミングについて 3 2022/08/11 20:31
- ゴミ出し・リサイクル 空トナー回収の件 3 2022/11/11 09:54
- その他(趣味・アウトドア・車) オールモード無線機について質問です。デザインがおしゃれで、機能性が良いオールモード無線機を知っている 1 2022/05/24 22:30
- Amazon 新規でAmazon商品ページ作成方法について 1 2022/03/28 00:22
- ドライブ・ストレージ USBでHDDやSSDなどをさして使えるNASはありますか?できれば品番やメーカー、商品ページのUR 6 2022/12/18 16:43
- その他(パソコン・スマホ・電化製品) ノートに貼られた書類のスキャン方法に関する質問 家族の書類をデータ化して整理しています。 その際にS 3 2023/04/07 13:49
- 不動産投資・投資信託 積み立てNISAの利子率の見方が分かりません 3 2022/06/19 16:32
- Amazon Amazon 1 2023/02/13 16:07
- カスタマイズ(バイク) YAMAHAのfz400 でクラッチを軽くしたいのですが良い方法はなんですか? フルード交換、ワイヤ 5 2023/06/29 23:10
- デジタルカメラ ヨドバシでネット注文した商品は自宅まで届きますか? 7 2022/04/14 19:20
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
form action="#"
-
ページの途中にリンクするとそ...
-
googleサーチコンソールで、重...
-
<a href="/">トップへ</a> こ...
-
ページ内の画像だけを一定時間...
-
WEBページのヘッダーフッターを...
-
Preタグ内URLからリンクは張れ...
-
オンマウスで出た説明文の色を...
-
<a target="_top" href="***.ht...
-
Excel VBAを使ってHTML生成をし...
-
httpdで接続が拒否される
-
秀丸の正規表現置換でこの文字...
-
Webサイトでアンカーポイントへ...
-
クリッカブルマップについて
-
Excelで、社外秘(閲覧のみ)と...
-
HTMLからフォルダを開きたい
-
HTMLページが勝手にダウンロー...
-
VBA URLDownloadToFileについて
-
HTMLで別PCのフォルダを開く
-
Webサイトから、txtファイルを...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
リンク先からリンク元の、同じ...
-
form action="#"
-
googleサーチコンソールで、重...
-
<a href="/">トップへ</a> こ...
-
ページの途中にリンクするとそ...
-
インラインフレーム内のアンカ...
-
Preタグ内URLからリンクは張れ...
-
画面を開いたときに指定位置ま...
-
httpdで接続が拒否される
-
ポップアップ画面にアンカーを...
-
WEBページのヘッダーフッターを...
-
インラインフレームの中に表示...
-
ページ内の画像だけを一定時間...
-
ページ内リンクで<a href="#任...
-
safariでアンカーリンクが動作...
-
iframe内の特定の場所にジャン...
-
HTMLリンクからPDFのしおりへリ...
-
ブックマークをするとタイトル...
-
ブラウザ依存?<a name="#xxx" ...
-
<a target="_top" href="***.ht...
おすすめ情報