プロが教えるわが家の防犯対策術!

AutoPagerizeを有効にさせたいページが有るのですが、
「SITEINFOの書き方入門」なるサイトを見ても、チンプンカンプンです。

実際に、AutoPagerizeを有効にさせるため、
SITEINFOの書き方を画像などで詳しく解説しているサイトってないでしょうか?
もしくは、書き方について勉強できる書籍を教えて貰えますでしょうか?

※アドオンのAutoPagerは使う気はありません。

A 回答 (2件)

不親切な解答をしたような気がするので、


簡単な例をあげてみたいと思います。
HTML:
<html><body><div class="main" id="main">
<p>なんとか</p>
<p><a href="2.html" class="next">次</a><p>
</div></body></html>

で、次のページへのリンクの XPATH は
/html/body/div/p/a[@class="next"]
とか
//a[contains(concat(" ", @class, " "), " next ")]
とか
//div[@class="main"]//a[contains(text(), "次")]
とか
id("main")//a[@class="next"]
とかと、できるだけ、唯一の要素になるように書きます。
実装によりますが、多分、一致した最初のものが使われると思います。

継ぎ足す要素も同じように
/html/body/div[@class="main"]
とか
//div[@class="main"]
とか
id("main")
とかと、これもできるだけ、唯一の要素になるように書きます。
こちらの場合は、一致した全ての要素を連結して継ぎ足すようです。

あとは対象にしたいサイトの URL を正規表現で書きます。
ただし、スラッシュはエスケープしなくても良いようです。
例えば http://www.example.jp/news/ をベースに 2013/09/29、2010/10/01
などがある場合、
^http://www\.example\.jp/news/.+
という感じで指定します。

アドオンなしでも、最近の Chrome、FireFox などでは、XPATHを簡単に
表示する開発ツールが、メニューからたどれるところにあるので、
対応したいサイトで、開発メニューを開いてみると良いと思います。

分かりにくいところがあれば、補足で指摘してください。

参考URL:http://ja.wikipedia.org/wiki/XML_Path_Language
    • good
    • 0
この回答へのお礼

ありがとうございました。勉強になりました。

お礼日時:2013/10/29 05:51

一番良いのは具体的に URL を示されることだと思います。



wedata データベースにアクセスして、そのキャッシュを
利用されているはずですから、需要があれば、登録されるでしょう。

SITEINFO 自体は XML XPATH の知識があれば、簡単です。
今見ているページの、次のページ、というものが定義しやすい、
blogや検索結果のようなフラットな構造なら、特に簡単かと思います。

"wedata autopagerize" で検索して、実際どのようなものか見れば、
書き方は自明です。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!