都道府県穴埋めゲーム

レストランのWEBページでよくあるパターン、「メニューはこちら」というアンカーのリンク先にランチメニューなどを、PDFファイルで置いてある、という奴。

この手のサイトは、更新チェックが結構な難題です。

サイト更新チェック用ソフトは、HTMLページ上の変更点ならば検出してくれます。

しかし、 href= や src= で指定される、リンク先のPDFファイルについては、ファイル名が変わるならまだしも、同じファイル名のまま、PDFファイルに書かれた内容が更新されても、変更内容どころか変更が有ったという「事件」すら教えてはくれません。

なので、
既存のサイト更新ソフトに頼らず、自前で、プログラムを組まねばかと思っています。

その際、
どんな技術を用いればリンク先PDFファイルの変更を検出できるでしょう?

変更検出のアイデア

[A.]
PDFの内容を読み取って変更を検知
→Adobeの製品を制御せねばなので、まずムリではないか・・

[B.]
PDFのファイルサイズが変化するハズだから、これを検出すれば、少なくとも変化の有ったことまでは知れる
→それには、どうすれば良い?

[C.]
PDFのタイムスタンプが変化するハズだから、これを検出すれば、少なくとも変化の有ったことまでは知れる
→それには、どうすれば良い?

この辺りまで考えて、煮詰まってしまっています。

ちなみに
PC環境はWINDOWS7
ブラウザはIE11またはChromeです。

私で手に負えそうな技術は

Javascript
VBA・VB
HTML・CSS DOMツリー
WIN32API
Windows Scripting Host
Windows Power Shell
あたりが限界で

C言語やJavaなどは
理解しきれませんです。

どなたか
ご助言いただければ幸いです。
よろしくお願い致します。

A 回答 (2件)

VBScriptで、


Dim XMLHTTP
Set XMLHTTP = CreateObject("MSXML2.XMLHTTP")
XMLHTTP.Open "HEAD", "http://example.com/path/foo.pdf", False
XMLHTTP.Send

If XMLHTTP.Status = 200 Then
WScript.Echo XMLHTTP.getResponseHeader("Last-Modified")
Else
WScript.Echo "ERROR CODE=" & XMLHTTP.Status
End If

で、更新タイムスタンプが取れます。
    • good
    • 0
この回答へのお礼

うわあ、有難うございます。
こんなこと、出来るんですね。
「IEオブジェクトを使わずにXMLHTTPオブジェクトを使ってHTMLソースを取得する方法」
という分野ですね、
勉強して身に着けてみます。

お礼日時:2015/07/04 12:56

おそらくWEB巡回ソフトをつかえば、


更新されたファイルを再度受け取ることはできます
    • good
    • 0
この回答へのお礼

ご回答有難うございます。

よろしければ
そのWEB巡回ソフトの具体的名称
教えてくださいませ。

お礼日時:2015/07/04 12:47

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!