
特定のウェブサイトから、定期的にある箇所の文字列を取得して、
リスト化するプログラムを作りたいと思っています。
例えば、
Yahoo!スポーツのプロ野球の所の個人成績のページから打率トップ5の選手名と
打率を毎日0時に自動的に取得してリスト化する
といった感じです。
こういったプログラムを作る場合どういった知識が必要になるのでしょうか?
私はCとC++の基本程度しか理解していないので、そのあたりを基礎に出来ればいいのですが。
C(C++)は、シンプルなフォームアプリケーションの世界時計が作れるくらいのレベルです。
それから、こういったプログラムを作る上で参考になる本やウェブサイトがあれば
教えていただきたいと思っています。
CやC++を基礎にしたいという事で、このカテゴリに質問させていただきましたが、
カテゴリ違いになってしまっていたら申し訳ございません。
No.1ベストアンサー
- 回答日時:
C言語が少しでもわかるなら、文字列の操作が結構面倒だってことは実感しているかと思います。
C++でstd::string等のクラスを使うと大分マシになりますが。
ご希望のような処理は「スクレイピング」と呼ばれています。
C/C++でも、勿論可能です。ただ、様々な文字列操作が必須ですので、どちらかと言えば、Cの苦手な分野です。
PHP,Perl,Ruby,Python等と言った言語は、文字列操作を得意としています。これらの言語でやるならば、参考になるサイトや参考書もたくさんあります。
まず、方針を決めましょう
・C/C++言語の技術を高めて、C/C++言語でやる。
参考書はほとんど無いが、「やり方」は他言語と同じなので、他言語の参考書やサイトから「やり方」だけを参考にする。
・スクレイピングが得意な言語を勉強してそちらでやる。
Cを知っている分、一からやるよりはましだが、それでも新しい言語の作法など覚えることは多い
No.2
- 回答日時:
Everyday Scripting with Ruby: For Teams, Testers, and You
という本に、アマゾンの本のタイトルとかをとる例があります。今の場合は Ruby での話です。
訳本も出てるんで、日本語でも読めます。
page = fetch(url)
page にurl で指定したページの内容を入れて、この中から欲しい情報を取り出します。
def fetch(url)
open(url, 'User-Agent' => 'ruby') { | response |
response.read
}
がfetch の内容ですが、open-uri というライブラリをつかっています。
実際、hep-th などの 数学や物理のプレプリントサーバーからファイルとって来た際、その論文のタイトルをファイル名から自動的にサイトに行って、拾ってくれるように書き換えて重宝しています。
ただ、気をつけないと、そのサイトに、何回もアクセスするような、失敗をやらかすと そのサイトから、IPアドレスにブロックがかかったりしますから、要注意です。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- C言語・C++・C# C言語で 英文字のみからなる文字列、”Radar”、”WasItACatISaw”、”a”、””(空 5 2022/12/20 15:17
- Visual Basic(VBA) 【再々投稿】VBAのプログラムで動作しなくて困っています 8 2022/10/14 09:06
- C言語・C++・C# [C言語] コメント文字列を無視して、数値データを読み込むプログラム部分について 5 2022/10/05 11:03
- Visual Basic(VBA) VBAにてメール作成した際、一部指定箇所のみ赤文字にしたいです。 下記の内容ですと作成されたメール本 1 2022/04/27 13:31
- その他(プログラミング・Web制作) プログラムの勉強のおすすめは 7 2022/12/09 20:09
- Excel(エクセル) Excelの関数について 3 2022/11/13 23:47
- JavaScript HTMLでJavaScriptを使用してプログラムを作ります。 入力されたパスワードを取得して、パス 2 2022/10/18 01:05
- 仕事術・業務効率化 効率的な勉強方法(分野問わず)を教えてください 1 2023/08/16 01:33
- Java javaでのプログラム(配列)について質問です. 2 2022/10/14 22:27
- PHP ここでの ②if($su_d<>"")の比較演算子 を使う理由は 1 2022/03/26 02:33
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
プログラミング言語の取得方法
-
C言語、C+、C++、C#の違い
-
COBOLで文字タイプを数字...
-
言語のことで。
-
プログラミングについてです。 ...
-
C言語とhtmlの違いを どな...
-
C言語 おすすめの本
-
UNITY Float型の接尾辞fって
-
プログラムに書かれる"%"記号の...
-
COBOLでのNOT = の AND条件
-
新しく挑戦する言語は・・
-
スプレッドシートの作成
-
初心者におススメのプログラミ...
-
EXCELの表示について
-
C++における継続行
-
プログラミング言語は何種類で...
-
AIを学ぶのに適しているプログ...
-
.Net Framework APIがあればMFC...
-
VB.NETからC言語への乗...
-
一問一答形式の英単語のクイズ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
プログラムからアイコンファイ...
-
C言語、C+、C++、C#の違い
-
COBOLでのNOT = の AND条件
-
C言語とhtmlの違いを どな...
-
プログラムに書かれる"%"記号の...
-
COBOLで文字タイプを数字...
-
UNITY Float型の接尾辞fって
-
HTMLとC++で、どんなホームペー...
-
Excel VBAで文字化けする (英語...
-
C++における継続行
-
TO_CHARで小数点以下がある場合...
-
VBScriptで引数を省略したい場合
-
VCとVC++
-
UWSCはどのプログラミング言語?
-
パスカルケースの由来。
-
vbaとc言語の関連性について
-
任天堂で使うプログラミング言...
-
Excelの開発言語ってなんですか?
-
C++ ってなんて読む?
-
VBSでDim、Private、Publicの違い
おすすめ情報