![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?8acaa2e)
他サイトにある数字を認識して自サイトに反映させるプログラムなど実現可能なのでしょうか。
たとえばある統計の結果を数ヶ月に一度更新しているサイトがあるとして、その2000人と書かれた数字が2050人と変わったときに自サイトの数値も2050として数値が変わる仕様です。
やっていることは無料閲覧できるサイト制作者のページを閲覧して数値を確認して、自サイトへ書き込むというアナログの作業が自動化できればなと考えています。
この手動が自動化することについては、やっていることは上記と同じことなので他サイト制作者の認可はもちろん得なくてもよいとは思います。
もしこれが実現されたとなれば他サイト所有者に許可を受けずとも(普通は認可いらないはず)こちらサイトの更新の手間が省けるのですが、このためには相手先のホームページからの行き着いたページのURLのページの位置の画像認識をして数値を割り出し、もしページの数値の位置が変わったときやページごとURLが変わったときなど変化があれば通知されるようなシステムになると思うのですが、こういったことは実現できるのでしょうか。
よろしくお願いいたします。
No.3ベストアンサー
- 回答日時:
面倒な処理さえなければ、割と簡単な類のプログラムでしょう。
Webプログラムを一年でも経験していれば、数日で出来上がると思います。
面倒が必要なら数週間ほど。
ただ「要求仕様」さえはっきり文章化できれば、
そうお高い買い物にはならないはずです。
書けないとなると、要求分析して要件定義して要求仕様を定めて...
となるのでうんびゃくまんの話になるでしょう。
頼むなら、安くなりそうな順に
* 知人の工学系学生に声をかける
* 知人の詳しそうな人に声をかける
* SNS で募集をかける
* SOHOお仕事サイト
* ソフト受託開発で検索
No.2
- 回答日時:
Webページの自動巡回ですね。
ボットとかクローラーとか呼ばれるプログラムを作成すれば可能です。
ただ以下のような事件が発生しかねないので、巡回の頻度はごく控えめに。
http://ja.wikipedia.org/wiki/岡崎市立中央図書館事件
どのような処理をするのかというと
* 目的ページのHTML文書を取得 (wget/XmlHttpRequest など)
* 文書を解析をして Document を得る (HTMLパーサ など)
* セレクタで目的の値をとる (querySelectorAllなど)
* 値を使って更新処理
* 以上のプログラムを繰り返し実行するように登録 (cron/タスク など)
目的の値が固定URLのページにテキスト値として含まれているならば、
スクリプト100行程度で実装できる簡単な処理ですが、
そうでないとすると飛躍的に難しくなります。
固定URLでないのなら
* HTML取得・解析・目的リンクを抽出して、目的ページURLを辿る処理
(かなり面倒)
値がテキストではなく画像なら
* 画像からテキストを読み取る処理 (OCRライブラリなど)
(とても面倒)
単純な一枚絵の画像でないなら
* Webページを丸ごと画像に保存する処理 (ブラウザの遠隔操作など)
* 目的部分だけを切り抜く処理
(えらく面倒)
素晴らしい。素晴らしすぎますよ。なるほど可能は可能なのですね。
こういったことはどこに頼むのがよいのでしょうか。どこに頼むかについては別質問としてたてたほうがよろしいでしょうかね。
少し聞きたいのですがあなたはプログラミングの業界ではかなり優秀な部類の方なのでしょうか。それとも少しでもわかっていればこのような類の技術はできるようなものなのでしょうか。もしどこかに依頼するとなったとき膨大な金額が請求されそうで不安ではあります。
回答ありがとうございました。
No.1
- 回答日時:
こんにちは。
実現できるか出来ないかで言えば、出来ます。
方法は多岐にわたりますので、環境に合わせて作ります。
ただし、許可に関する部分は認識が違います。
スクレイピングと言われている技術になりますが、サイトによっては許可していない場合があります。
ただ、1秒に何回もリクエストを送るとか、そんなことをしなければ大丈夫だと思いますが。
(検索サイトのbotも同じようなもんですしね)
回答ありがとうございます。
実現可能なのですね。本当にすごいことだと思います。
プログラミングというのは限界を感じさせませんね。
本当にありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- HTML・CSS WEBサイトの構築。表示データとWEBデザインを分離する考え方を専門用語・業界用語では何と言うか? 8 2022/09/27 09:16
- その他(ブラウザ) IE・edgeで日増しに観られるサイトが減ってくる。 1 2022/10/04 22:40
- PHP $_SESSIONに渡した後はそのまま使っても問題ありませんか? 3 2022/11/08 22:17
- Excel(エクセル) Excelの関数で可能でしょうか、日付や式の値の自動更新 4 2023/05/19 17:17
- HTML・CSS リンクバナーのHTMLタグ。画像を変えたり、設置位置を変えるとバナー貼付け側はどう見える? 2 2023/02/01 12:01
- その他(プログラミング・Web制作) Windowsのマクロプログラムで、こんなことできますか? 3 2022/06/28 14:30
- その他(ブラウザ) このページは動作していません HTTP ERROR 401 2 2022/11/28 12:11
- その他(ブログ) 二次創作用のサイトを開設し漫画を投稿したい。 二次創作の漫画を描いている者です。pixivやTwit 1 2022/04/13 20:51
- Chrome(クローム) PCの Google Chrome が頻繁に「ページが応答していません」となり作業が進みません。 1 2023/05/25 20:43
- WordPress(ワードプレス) ワードプレスで、投稿一覧ページにタグを表示する方法 投稿につけたタグを、記事一覧ページにもカテゴリと 1 2023/05/10 21:41
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
小数点を含む数値かどうか判断...
-
Excelでのセル内容の高速消去方法
-
WindowsMessage(ウィンドウメッ...
-
エクセルVBA 時間抜けの取得
-
絶対パスの取得について
-
ナップザック問題?をエクセル...
-
C#で書かれたプログラムをバッ...
-
Timerを使用しての強制待機
-
ExcelVBA処理経過をリアルタイ...
-
SQLの速度をあげるには・・・
-
C言語 再帰処理のメリットとデ...
-
実行時のCPU使用率を増やしたい
-
C言語:関数を使うメリットとデ...
-
VB 電卓 メモリー機能
-
DoEvents関数って何?
-
符号付きにすべきか、符号なし...
-
ソートにかかった時間を測りたい。
-
プログラム上のCPU稼働率低減に...
-
計算処理時間を出力したい!
-
C言語 時刻差分の算出方法
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
DoEvents関数って何?
-
win10で、正確な待ち時間の作り方
-
Excelでのセル内容の高速消去方法
-
小数点を含む数値かどうか判断...
-
Chat GPTに、課題として、二と...
-
SQLの速度をあげるには・・・
-
絶対パスの取得について
-
WebBrowserの読み込み待ちの処...
-
実行時のCPU使用率を増やしたい
-
ノットイコールを教えて下さい
-
プログラム上のCPU稼働率低減に...
-
C言語:関数を使うメリットとデ...
-
Excel(VBA)でSetTimer関数を使...
-
あっち向いてホイのプログラム...
-
VC++2010 GDIオブジェクトの解...
-
If Not c Is Nothing Then ~延...
-
Excel VBA での処理時間計測結...
-
符号付きにすべきか、符号なし...
-
ソートにかかった時間を測りたい。
-
プログラミングの授業でPython...
おすすめ情報