dポイントプレゼントキャンペーン実施中!

お世話になります。マクロは全然分からないのですが、どうやらマクロで可能なようですので、質問させてください。
宜しくお願い致します。

【質問】複数のhtmlファイルが保存してあります。その各htmlファイルから、適切な部分を抜き出してエクセルに貼り付けたいのですが、どうすれば良いでしょうか。

例)dbr02.html、4107989208.html、45_3d.html という3つのファイルがあったとします。(実際は数千ファイルあります)
それぞれのファイルから、商品番号、商品名、キャッチコピー、商品説明文、商品画像を抜き出して、エクセルに貼り付けるには、マクロでどのように記述すれば良いでしょうか。
-------------------------------------------------------------------------------------------------
※各セルに挿入したいデータは下記の通りです。

【A1~E1】1行目は取り込みデータではなく、文字列です。
セルA1:商品番号、B1:商品名、C1:キャッチコピー、D1:商品説明文、E1:商品画像
【A2~E2】
dbr02.htmlから抜き出した「商品番号」「商品名」「キャッチコピー」「商品説明文」「商品画像」をそれぞれ、A2、B2、C2、D2、E2へ取り込む
【A3~E3】
4107989208.htmlから抜き出した「商品番号」「商品名」「キャッチコピー」「商品説明文」「商品画像」をそれぞれ、A3、B3、C3、D3、E3へ取り込む
【A4~E4】
45_3d.html から抜き出した「商品番号」「商品名」「キャッチコピー」「商品説明文」「商品画像」をそれぞれ、A4、B4、C4、D4、E4へ取り込む

以下、同様に、保存してある全てのファイルを取り込む。取り込む順番はランダムで大丈夫です。
-------------------------------------------------------------------------------------------------
【その他仕様】
htmlファイル保管場所:C:\Users\moto\Desktop\data
商品番号:半角英数字、アンダーバー、半角ハイフンが使用されている場合があります。
ソースについて:それぞれ、下記のくくりで、記載されています。(*が抽出したい部分です。また、該当する箇所は各ファイルに1ヵ所しかありません。)

<th>商品管理番号</th><td>******</td></tr><tr><th>ブランド名</th>
<!--商品名-->******<!--/商品名-->
<!--キャッチコピー-->******<!--/キャッチコピー-->
<!--商品コメント-->******<!--/商品コメント-->
<!-- 商品詳細画像 --><div style=" height:1px; width:1px; overflow:hidden;"><img src="******" alt="" class="imageborder" name="photoName1" id="photoName1" onClick="overSizeLink('photoName1')"><br></div><!-- /商品詳細画像 -->

質問者からの補足コメント

A 回答 (2件)

#1の回答者です。



この先のお話は、Excelカテゴリに移します。
Excelカテゴリには、最近、同じような回答を私自身がしてきた経緯があります。
ただし、こちらで出ていた質問内容は、そのまま活かさせていただきます。
よろしくお願いします。
    • good
    • 0
この回答へのお礼

ご対応いただきまして、ありがとうございます。
宜しくお願い致します。

お礼日時:2015/04/04 19:00

こんにちは。



直接の回答ではないことを、予めお詫びいたします。

Excelカテゴリにも、同様の質問を載せましたでしょうか?
一応、こちらの方が前ですから、こちらに返事を付けておきます。HTMLの中身のコードの一部を出して、それだけで必要項目を取り出せという質問は、かなり無理がありますね。HTMLファイルの中身は、テキストファイルだから、テキストで取れるというのは確かですが、マクロでは、必ずしも、テキストのソースコードを探るとは限りません。ファイルの構造を調べて、なるべくピンポイントで検索するのが一般的で、ソースコードの全文検索なんていうのは、最悪の手段だということです。

どんなファイル構造になっているのか、それで組み立てていきますから、質問項目だけで、1,000以上のファイルから取り出せるとは思えません。仮に、一部を出すにしても、「<th>商品管理番号」の前に class があるはずです。

そのダミーのHTMLファイルをどこかに出していただけるか、どこそこのサイトのHTMLファイルだというぐらいに示してくださらないと、回答者側としては、とても返事は付けられないように思います。
    • good
    • 1
この回答へのお礼

ご回答頂きまして、ありがとうございます。
2か所に似たような質問をしまして、申し訳ございません。質問のカテゴリーを間違えたかと思い、修正しようとしたのですが、分かりませんでした。また、質問内容にそもそも無理があり、ご回答頂けないのかもしれないと思い、もう少し出来そうな内容で改めて質問させていただいた次第です。

この質問ですが、知識がほとんどない中で、こうすれば出来そうだと思い、質問させていただきましたが、最悪の手段なのですね。HTMLファイルを載せたかったのですが、載せたらだめなのかも?と思い、載せれませんでした。質問が削除対象にならないか、不安でしたので。良く考えましたら、右クリックでダウンロード可能な公開されているデータですから、問題ないですね。補足に載せてみます。

お礼日時:2015/04/04 12:40

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!