サイトからソースを取得することはできるのですが、
そのソースからほしいデータを抽出するうまいやり方がわかりません。
具体的には
http://table.yahoo.co.jp/t?c=2006&a=5&b=8&f=2006 …
↑のようなサイトからデータの部分だけをメモ帳に移したいです。
どのようにすればいいですか?
ちなみに今は strtok 関数を使って無理やりアルファベットを取り除いていますが、
エラーが多いです。
A 回答 (1件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
★文字列を検索して解読するしかないと思います。
・アルゴリズムとしては、
(1)『<td><small>』を検索します。→strpbrk関数で検索。
(2)見つかったポインタに +11 を加えれば、『<td><small>』に続くデータの先頭位置になります。
(3)(2)のデータの先頭から『<』文字までを抽出します。
『<』文字をNULL文字に書き換えれば、データの先頭から普通の文字列として扱えます。
(4)(3)のデータの末尾から +1 の位置より、『<td><small>』を再検索します。→(1)へジャンプ
・上記を繰り返せば、TABLE タグのデータを取り出せます。
・あと途中に『<b>』と『</b>』の部分があるので『<td><small>』を検索した後にポインタを +11 して
『<b>』文字列の先頭の場合は『<b>』をスキップします。→ポインタを +3 進める。
・後ろにある『</b>』は『<』文字としてデータの末尾としているので(3)と同じです。
・HTMLソースを行単位で処理しても良いし、全てをメモリに読み込んで検索しても良いでしょう。
・以上。おわり。→行単位で文字列を解読しましょう。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- HTML・CSS 別サイトのHTML内にある情報を自動取得して、自分のサイトに組込む方法を教えてください。 例えば、Y 1 2023/06/15 08:09
- Excel(エクセル) VBA : スクレイピングできない 4 2023/05/12 22:26
- オープンソース Python openpyxlを使用したセル番地の使用について 1 2023/08/03 22:05
- その他(プログラミング・Web制作) Windowsのマクロプログラムで、こんなことできますか? 3 2022/06/28 14:30
- レシピ・食事 お家でステーキを食べる時は、どんなソースが好きですか? 17 2022/09/13 09:26
- Visual Basic(VBA) Selenium.ChromeDriverの使い方について 7 2022/09/22 06:43
- オープンソース ChatGPTをスプレッドシートと連携して自動でリサーチしたいんですがうまく出来ません。。。 1 2023/05/05 15:59
- Excel(エクセル) EXCELの外部データ取得ができない 1 2023/03/23 09:03
- HTML・CSS WEBサイトの構築。表示データとWEBデザインを分離する考え方を専門用語・業界用語では何と言うか? 8 2022/09/27 09:16
- Access(アクセス) アクセス where句を使用して複数条件抽出をするには 2 2022/08/29 13:24
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
教えて下さい
-
配列でデータが入っている要素...
-
Accessで該当データにフラグを...
-
【エクセル】測定時間がバラバ...
-
メモ帳(テキストデータ)をExc...
-
MSCommを用いたRS-232-Cデータ転送
-
S9タイプからXタイプにデータ...
-
EXCELVBAでSQLserverからデータ...
-
[C言語] コメント文字列を無視...
-
PLSQLで文字列置換
-
VBAを使ってOutlookメール本文...
-
fortranでフーリエ変換→パワー...
-
VBA 毎日取得するデータを順番...
-
カンマからスラッシュに
-
C# ソケット通信でデータ受信時...
-
HTMLでテキストボックスで...
-
PDOオブジェクトは使い回し可能?
-
Excelのマクロでワードのテキス...
-
Excelの関数で表示されているデ...
-
GETはできるがPOSTができない、...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
教えて下さい
-
配列でデータが入っている要素...
-
【エクセル】測定時間がバラバ...
-
メモ帳(テキストデータ)をExc...
-
VBA 空白セルを削除ではない方...
-
多量のSUMIF式を軽くしたい
-
Excelのマクロでワードのテキス...
-
エクセルで2つの時系列のデー...
-
この行は既に別のテーブルに属...
-
VBAを使ってOutlookメール本文...
-
シーケンサにパソコンからアク...
-
EXCELVBAでSQLserverからデータ...
-
ブレーカー落ちで壊れたりしな...
-
[C言語] コメント文字列を無視...
-
オープンチヤットでデータ削除...
-
モジュラス103の算出方法について
-
javaでDBからデータを取ってき...
-
カンマからスラッシュに
-
VBA 毎日取得するデータを順番...
-
Android携帯をUSBメモリ代わりに
おすすめ情報