プロが教える店舗&オフィスのセキュリティ対策術

補足説明に記載したかったのですが、文字数制限の為、こちらに記載致しました。全文ではございませんが、やり方が判れば、こちらで多少加工は出来そうですので、これがソースの全文と仮定してご回答頂ければ幸いです。

"

<h2 class=""dlpo-1-1"">商品紹介</h2><!-- ←DLPO -->
<div id=""catchComment"">
<div class=""inner"">
<h3><!--キャッチコピー-->履くダイエットの大定番!<!--/キャッチコピー--></h3>
<p>
<!--商品コメント-->商品詳細:<br>履くダイエットの大定番!<br>段階式着圧設計でほっそり美脚をサポート。<br>お肌の透け感がある25デニールのゾッキパンスト。<br>つま先補強タイプ。<br>商品サイズ:105×135×30(mm)<br>ケース入数:240<!--/商品コメント--></p>
</div>
</div>

<tr class=""firstRow"">
<th>商品管理番号</th>
<td>4545633002374</td>
</tr>
<tr>
<th>ブランド名</th>
<td>あいうえお株式会社
</td>
<!-- <td>あいうえお株式会社()</td> -->
</tr>
<tr>
<th>サイズ・容量</th>
<td>1足</td>
</tr>
<tr>
<th>規格</th>
<td>原産国:日本</td>
</tr>
<tr>
<th>注意事項</th>
<td>商品パッケージ画像やアテンションシール、キャッチコピー・文言は予告なく変わることがあります。<br> <img src=""../../../image.space.rakuten.co.jp/d/strg/ctrl/6/9f5a7f69a4120a16a709e75ac20dd03af1d6776c.04.1.6.2.jpg""></td>
</tr>
<tr>
<th>出荷条件</th>
<td>1~5営業日程度での出荷予定(最短翌日出荷。在庫不足の場合、メーカー様より仕入後の納品となります。)</td>
</tr>

<tr>
<th>注文について</th>
<td>
取引申請が必要です
</td>
</tr>
<tr>
<th>良品返品</th>
<td>


不可
</td>
</tr>
<tr>
<th> 支払条件<br>
販売条件<br>
返品条件</th>
<td><a href=""#torihikijyouken"">こちらをご覧ください</a><br>
出展企業毎に異なりますので、必ずご確認ください</td>
</tr>
<tr>
<th>登録/更新</th>
<td>2015/04/02</td>
</tr>
</table>
</div>
</div>
</div> <!-- /itemInfo -->
</td>
</tr>
</table> <!-- id=""layoutTable2"" -->
<div class=""contEnd"">
<hr>
</div>
</div> <!-- /itemInfo1 -->

<div class=""dlpo-6-5_2""></div><!-- ←DLPO -->

<!---->
<div id=""itemInfo2"" class=""line2"">
<!---->
<div id=""cartTable"">
<p class=""align_right"">かきくけこは内税ですが他の卸提示価格との比較のために、外税の参考額として表示しております。</p>
<div class=""inner"">
<div class=""inner1"">
<div class=""inner2"">
<table border=""0"" cellspacing=""0"" summary=""トレイン カロリー237着圧PS BKの商品明細情報"">
<tr id=""headRow"">
<th class=""col1"">注文欄<br>
番号</th>
<th class=""col2"">商品管理<br>
番号</th>
<th class=""col3"">内訳</th>
<th class=""col4"">
メーカ希望小売価格
</th>
<th class=""col5"">
卸価格<!----></th>
<th class=""col6"">セット毎数量
</th>
<th class=""col7"">ご注文セット数</th>
</tr>

<tr class=""odd"">
<td class=""setId""> 1
<input type=""hidden"" name=""set_id_1"" value=""1""></td>
<td>4545633002374</td>
<td>カロリー237着圧PSBK</td>
<td>
800円/点(税込)
</td>
<td>

</td>
<td>
<div align=""right"">
<!---->
1点
</div>
</td>
<td>
<input type=""hidden"" name=""set_num_1"" value=""1"">
<!---->
<!---->
卸価格閲覧・ご注文には<br>
会員登録(ログイン)が必要です<br>
<div class=""reg_login_btn""> <a href=""https://www.aaaaaa.jp/regist/index.html_registTr …仕入れ会員登録</span></a> </div>
<div class=""reg_login_btn""> <a href=""../../dap/sv/Login_.html""><span>ログイン</span></a> </div>
</td>
</tr>

<tr class=""even"">
<td class=""setId""> 2
<input type=""hidden"" name=""set_id_2"" value=""2""></td>
<td>4545633002374</td>
<td>カロリー237着圧PSBK ×240点セット</td>
<td>
800円/点(税込)
</td>
<td>

<!---->

<!---->
</div> <!-- class=""inner2"" -->
</div> <!-- class=""inner1"" -->
</div> <!-- class=""inner"" -->
</div> <!-- id=""cartTable"" -->

<div id=""orgPhoto"">
<img src=""../../../img04.aaaaaa.jp/ex36/sign_image/6/357136/S357136.jpeg"" alt=""あいうえお株式会社"">
<br>
<input type=""hidden"" name=""imageCopyOk"" id=""imageCopyOk"" value=""0"">

<!-- 商品詳細画像 -->
<div style="" height:1px; width:1px; overflow:hidden;"">
<img src=""../../../img03.aaaaaa.jp/ex34/20141120/7/6436467_0.jpg"" alt="""" class=""imageborder"" name=""photoName1"" id=""photoName1"" onClick=""overSizeLink('photoName1')""><br> </div>
<!-- /商品詳細画像 -->

質問者からの補足コメント

  • ご回答ありがとうございます。

    >各社各様で、いろんなスタイルがあるのではないでしょうか。
    確認致しましたところ、別の会社では、キャッチコピーが存在しませんでした。最初に存在しなければ弾く設定ではなく、存在する部分だけを抽出する用、お願い致します。
    また、キャッチコピーがある場合は、必ず><!--キャッチコピー-->商品名<!--/キャッチコピー-->となっているものとしてください。現在は、「商品説明」等も必ずそうなっているように思いますが、後日修正が必要となる場合もあり得ますので、その部分にコメントをつけていただけると助かります。

    >画像につきましては、ハイパーリンクは、無い方がありがたいです。その記載を画像をダウンロードするソフトに貼り付けてダウンロードする予定です。ただ、1画像では無く、画像数は最少1~最大10のランダムだと判明しました。仕様変更となりまして大変申し訳ございません。

    No.2の回答に寄せられた補足コメントです。 補足日時:2015/04/06 19:26
  • <!-- 商品詳細画像 --><div style=" height:1px; width:1px; overflow:hidden;"><img src="http://img04.a.jp/ex15/201504/9/68_0.jpg" alt="" class="imageborder" name="photoName1" id="photoName1" onClick="overSizeLink('photoName1')"><br><img src="http://img04.a.jp/ex15/201504/9/68_1.jpg" alt="" class="imageborder" name="photoName2" id="photoName2" onClick="overSizeLink('photoName2')"><br></div><!-- /商品詳細画像 -->

      補足日時:2015/04/06 19:40
  • >「全文」という言葉で、何が「全文」なのか、よく分っていません。
    各htmlファイルの中身全部です。該当箇所のみ抽出するのが難しいようなら、全部丸ごとなら可能かと思いました。マクロの段階で、該当箇所を抽出する事を最初に考えましたが、それは厳しいようならばマクロの段階では各ファイルを丸ごと抽出しておいて、MID関数等で該当箇所を後から抽出出来ないかと思いまして、全文抽出のマクロも希望しました。

    >エラーのことです
    キャッチコピーが存在しない場合でも、他の部分が存在する場合は抽出しなくてはなりません。キャッチコピーは必ずしも入っているとは限らないので、そういう場合もあります。

    ><tr class=""firstRow"">はどうするのでしょうか?
    不要です

    >画像アドレスは、1セルに半角スペース区切りでお願い致します。最大10アドレスです。サムネイルや、画像の取得は不要です。

    No.3の回答に寄せられた補足コメントです。 補足日時:2015/04/07 00:18
  • ありがとうございます。
    確認しましたが、エラーがあり、動きませんでした。まず、下記で「'」がなく、コメント扱いになっていなかったので、修正しました。
    >ReDim FileNames(5000) ファイル数は、5001まで処理をします。

    再度実行しましたが、インデックスが有効範囲にありませんというエラーで動きません。こちらは修正方法が分かりません。
    > ReDim Preserve FileNames(i - 1)

    ここから先は進めておりませんので、その他は大丈夫なのかは不明です。お手数ですが、一度htmlファイルを読み込んで、問題なく動作した物を、掲載いただけると助かります。

    No.4の回答に寄せられた補足コメントです。 補足日時:2015/04/07 15:11
  • すみません。正しく設定したつもりですが、間違っていたのかもしれないですね。
    フルパスを右クリックしてコピぺしましたので、スペルミスはありませんが、どこか間違っていますか。また、拡張子はhtmlのみです。

    Dim oHtml As HTMLDocument
    Dim cnt As Long
    Dim FName As String
    Const sPATH As String = "C:\Users\aaa\Desktop\item" 'HTMLのフォルダー

    FName = Dir(sPATH & "*.htm?", vbNormal)
    ~~~~~~~~~~~~~~~
    ReDim Preserve FileNames(i - 1) ここでエラーになります。
    エラー内容:実行時エラー'g':
    インデックスが有効範囲にありません。

    No.5の回答に寄せられた補足コメントです。 補足日時:2015/04/08 02:15
  • photoName1~photoName10迄の名前は、各htmlファイルで1か所しかありません。

    getElementById("photoPreview")をgetElementById("photoName1")にするのかも?と思いましたが、うまく行きませんでした。ソースは必要そうな部分を抜き出して、アドレスだけ「qqqq.jp」に変更してありますが、他は一切変更しておりません。必要な個所が不足しているようならば全文もお渡ししたいですが、やり方がわかりません。ここだと文字数オーバーになります。

    No.10の回答に寄せられた補足コメントです。 補足日時:2015/04/09 12:41

A 回答 (12件中11~12件)

こんにちは。



昨日、レスを書きかけていたのですが、もう少しまとめたほうがよいと思いました。
ほぼ、バグ潰しも終わり、全体は出来上がったものの、

>【A1~E1】1行目は取り込みデータではなく、文字列です。
>セルA1:商品番号、B1:商品名、C1:キャッチコピー、D1:商品説明文、E1:商品画像
>【A2~E2】
>dbr02.htmlから抜き出した「商品番号」「商品名」「キャッチコピー」「商品説明文」「商品画像」をそれぞ>れ、A2、B2、C2、D2、E2へ取り込む

前回もお書きしたことですが、まったく同じフォーマット(書式)で出来上がっているのでしょうか?
どうも、そうではないような気がするのです。それを言っても、現場にいるのではないので、しょうがないのかもしれませんが。場合によっては、商品名の中にほとんど入ってしまうこともありえます。

//
<h3><!--キャッチコピー-->履くダイエットの大定番!<!--/キャッチコピー--></h3>
<p>
<!--商品コメント-->商品詳細:<br>履くダイエットの大定番!<br>段階式着圧設計でほっそり美脚をサポート。<br>お肌の透け感がある25デニールのゾッキパンスト。<br>つま先補強タイプ。<br>商品サイズ:105×135×30(mm)<br>ケース入数:240<!--/商品コメント--></p>
//

かならず、こうなら問題はないのです。各社各様で、いろんなスタイルがあるのではないでしょうか。

htmlのソースの取り方がお分かりになるようなので、「<!--キャッチコピー-->」「<!--商品コメント-->商品詳細」の部分は、確認していただけませんか?

ただし、一番最初の部分が取れない時には、現在は、そのファイルは弾くようにしています。

それとも、もう一つ問題は、根本的なことですが、htmlファイルのスタイルなのです。
問題のhtmlファイルは、フォルダとファイルと二重になっていますか?画像データは、フォルダ側に入っています。画面に貼り付ける時は、サムネイルを使い、サムネイルの中にハイパーリンクを埋め込むことにしました。

「希望している結果を得られるマクロ」となるのか、私にも分からないのです。
期待していたにも関わらず、そうではなかった、ということが、ないとは言い切れませんから。

画像の分類は、以前にかかれていた内容を使いました。画像の上は、エクセルのシートで、下は、フォルダーの中身です。下のフォルダーから画像を探します。
「前の質問のソースです」の回答画像2
この回答への補足あり
    • good
    • 0

こんにちは。



いろいろ振り回させてすみませんです。
回答の軸をこちらにさせていただきます。

このソースは、まず、調整しなおさないといけませんね。
本当は、どこかの臨時のダウンロードサイトやフリーサイトで、ソースの固有情報だけを抜いて、それを置いていただければと思っていました。ここのサイトが改編になる前は、そういう方が時々いらっしゃいました。個人のプライバシーが守られればよいので、それでも、お咎めありませんでした。

ここのサイトの規約は表向きはあまり変わらないようでも、内部的な運営側の対応が、民間と地方公共団体の違いぐらいにかなり変わったようで、それをあえてお勧めするというわけにもいきません。今のソース・ファイルですと、だいたい、3分の1程度です。これでできるのかな、という不安は感じています。

私が考えているベストの方法は、
http://oshiete.goo.ne.jp/qa/8954389.html
と同じように考えてます。まあ、そちらの回答自体は、うまくいっていないのは、やはり半端な数ではないということと、当たり前のお約束のエラー処理を徹底していないからです。手抜きでもなかったのですが、勢いで作ったので、不備があるわけです。逆に質問者さんに問題を出してしまったというようなスタイルになっています。

実際は、このスレの添付画像のように、HTMLファイル(オブジェクト)にして探すという方法を考えています。しかし、そのクラス名が、ファイル自体で、それぞれ変わるのでしょうか?そうすると、タグで探していくのか、それでもうまくないと、前回書いた文字と文字の間の検索方法になるかと思います。ただ、そのスピードが遅いのです。とりあえず、試しにやってみようと思っています。ただし、必ずできるというような、期待はしないほうがよいです。
「前の質問のソースです」の回答画像1
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
何度も読み返しましたが、残念ながら、さっぱり分かりません。似た例もご提示いただきましたので、そちらも何度も読みましたが、似ているようにも全くみえず、理解できませんでした。
プログラムの知識は、ほとんど無い為、そういう事をするマクロは、これです、という回答を求めています。私が得たい結果は、お分かりだと思います。手段は最悪とのご指摘ですので、手段は問いませんので、希望している結果を得られるマクロをご提示いただければありがたいです。
宜しくお願い致します。

お礼日時:2015/04/05 01:49

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!