アプリ版:「スタンプのみでお礼する」機能のリリースについて

大量の店舗ページのHTMLデータがあるのですが、
テキスト、画像パスのみCSVあるいはExcelでリスト化して
書き出す方法何かないでしょうか?

お手数おかけいたしますが、ご協力のほどよろしくお願いいたします。

質問者からの補足コメント

  • みなさま、ご回答ありがとうございます。

    プログラムに関しては、無知なので、
    できれば簡単に一括で、大量のHTMLをcsvに変換できるフリーソフトが
    あれば教えていただけると助かります。

    ちなみにHTMLデータはローカルにございます。

    やりたいこととして、
    大量のHTMLデータをcsvに変更し原稿をリスト化した後、
    下記のbptranを使って新しく作った店舗ページのhtmlフォーマットに
    一気に変更してリニューアルしたいと思っております。
    http://www.vector.co.jp/soft/win95/net/se157300. …


    お手数おかけいたしますが、ご協力のほどよろしくお願いいたします。

      補足日時:2015/05/15 10:07

A 回答 (5件)

プログラムを作りましょう



1. HTML ファイルを HTML パーサーに喰わせる
2. 目的の情報を XPath または Selector で指定して抜き出す
2.1. テキストなら Selector で '.content p' の結果を textContent で参照とか
2.2. 画像パスなら XPath で '//img/@src' とか
3. 抜き出した結果を編集してCSVファイル出力
3.1. Windows 環境なら、Excel を ActiveX で操作して出力もあり
3.2. Unix 環境なら、POI とかで Excel 出力もあり

参考)
http://www.google.co.jp/search?q=html+parser+お好きな言語名
https://developer.mozilla.org/ja/docs/XPath
http://www.w3schools.com/cssref/css_selectors.asp
https://msdn.microsoft.com/ja-jp/library/office/ …
http://ja.wikipedia.org/wiki/Apache_POI
    • good
    • 1

データ変換の難易度は、元のHTMLデータの構造に大きく依存します。


どのような構造のHTMLであってもそれらしくCSVに変換するようなソフトは、おそらくどこを探しても見つからないでしょう。

元のHTMLデータと変換後のCSVのサンプルが提示できれば、もう少し具体的な回答がつく可能性があります。
それが不可能で、ご自身でもプログラミングしないのであれば、どこかに外注して作ってもらうしかないかもしれません。
    • good
    • 1

・URL抽出できるブラウザを使う

    • good
    • 1

画像ファイル名以外を「,」カンマにすれば、csvファイルになります

    • good
    • 1

ローカルにデータがあるならgrepで。


WEB上から引っ張る必要があるならさらにクローラが必要
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!