
No.4ベストアンサー
- 回答日時:
プログラムを作りましょう
1. HTML ファイルを HTML パーサーに喰わせる
2. 目的の情報を XPath または Selector で指定して抜き出す
2.1. テキストなら Selector で '.content p' の結果を textContent で参照とか
2.2. 画像パスなら XPath で '//img/@src' とか
3. 抜き出した結果を編集してCSVファイル出力
3.1. Windows 環境なら、Excel を ActiveX で操作して出力もあり
3.2. Unix 環境なら、POI とかで Excel 出力もあり
参考)
http://www.google.co.jp/search?q=html+parser+お好きな言語名
https://developer.mozilla.org/ja/docs/XPath
http://www.w3schools.com/cssref/css_selectors.asp
https://msdn.microsoft.com/ja-jp/library/office/ …
http://ja.wikipedia.org/wiki/Apache_POI
No.5
- 回答日時:
データ変換の難易度は、元のHTMLデータの構造に大きく依存します。
どのような構造のHTMLであってもそれらしくCSVに変換するようなソフトは、おそらくどこを探しても見つからないでしょう。
元のHTMLデータと変換後のCSVのサンプルが提示できれば、もう少し具体的な回答がつく可能性があります。
それが不可能で、ご自身でもプログラミングしないのであれば、どこかに外注して作ってもらうしかないかもしれません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ファイル形式またはファイル拡...
-
シェルコマンドの 2>&1 とはど...
-
ファイルの文字コードをUTF-8に...
-
raw形式からbmp形式への書き込...
-
VC++でUTF-8のファイルを出力し...
-
(VBA)書式が変更されてしまい...
-
コマンド(例えばls)の出力結果...
-
COBOLのファイル出力
-
Wordマクロで指定したフォルダ...
-
Acccess レポートをグループ別...
-
AccessVBA複数レポート条件毎に...
-
C言語初心者の質問失礼します。
-
Wordファイルの結合
-
SGファイルって何ですか?
-
フルパスから最後のディレクト...
-
バッファとは何ですか
-
FTPでputすると空ファイルが出...
-
営業秘密の漏洩について
-
実行ファイルと実行モジュール...
-
絶対パスの絶対て英語で何でし...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ファイル形式またはファイル拡...
-
Acccess レポートをグループ別...
-
CSVファイルを任意の場所に出力...
-
テキストファイルに改行コード...
-
コマンド(例えばls)の出力結果...
-
シェルコマンドの 2>&1 とはど...
-
ファイルの文字コードをUTF-8に...
-
(VBA)書式が変更されてしまい...
-
BitBltについて。
-
SendKeys "^V", True(貼り付け...
-
Excel のページを Jpegファイル...
-
【ExcelVBA】UTF-8(BOM無)でC...
-
VB.NETでExcelファイルを出力す...
-
AccessVBA複数レポート条件毎に...
-
raw形式からbmp形式への書き込...
-
Paiza Cloudです。 どうやれば...
-
OCRで起こしたテキスト文字をCS...
-
Wordマクロで指定したフォルダ...
-
C言語での縦方向のファイル出力...
-
VC++でUTF-8のファイルを出力し...
おすすめ情報
みなさま、ご回答ありがとうございます。
プログラムに関しては、無知なので、
できれば簡単に一括で、大量のHTMLをcsvに変換できるフリーソフトが
あれば教えていただけると助かります。
ちなみにHTMLデータはローカルにございます。
やりたいこととして、
大量のHTMLデータをcsvに変更し原稿をリスト化した後、
下記のbptranを使って新しく作った店舗ページのhtmlフォーマットに
一気に変更してリニューアルしたいと思っております。
http://www.vector.co.jp/soft/win95/net/se157300. …
お手数おかけいたしますが、ご協力のほどよろしくお願いいたします。