
No.2ベストアンサー
- 回答日時:
不親切な解答をしたような気がするので、
簡単な例をあげてみたいと思います。
HTML:
<html><body><div class="main" id="main">
<p>なんとか</p>
<p><a href="2.html" class="next">次</a><p>
</div></body></html>
で、次のページへのリンクの XPATH は
/html/body/div/p/a[@class="next"]
とか
//a[contains(concat(" ", @class, " "), " next ")]
とか
//div[@class="main"]//a[contains(text(), "次")]
とか
id("main")//a[@class="next"]
とかと、できるだけ、唯一の要素になるように書きます。
実装によりますが、多分、一致した最初のものが使われると思います。
継ぎ足す要素も同じように
/html/body/div[@class="main"]
とか
//div[@class="main"]
とか
id("main")
とかと、これもできるだけ、唯一の要素になるように書きます。
こちらの場合は、一致した全ての要素を連結して継ぎ足すようです。
あとは対象にしたいサイトの URL を正規表現で書きます。
ただし、スラッシュはエスケープしなくても良いようです。
例えば http://www.example.jp/news/ をベースに 2013/09/29、2010/10/01
などがある場合、
^http://www\.example\.jp/news/.+
という感じで指定します。
アドオンなしでも、最近の Chrome、FireFox などでは、XPATHを簡単に
表示する開発ツールが、メニューからたどれるところにあるので、
対応したいサイトで、開発メニューを開いてみると良いと思います。
分かりにくいところがあれば、補足で指摘してください。
参考URL:http://ja.wikipedia.org/wiki/XML_Path_Language
No.1
- 回答日時:
一番良いのは具体的に URL を示されることだと思います。
wedata データベースにアクセスして、そのキャッシュを
利用されているはずですから、需要があれば、登録されるでしょう。
SITEINFO 自体は XML XPATH の知識があれば、簡単です。
今見ているページの、次のページ、というものが定義しやすい、
blogや検索結果のようなフラットな構造なら、特に簡単かと思います。
"wedata autopagerize" で検索して、実際どのようなものか見れば、
書き方は自明です。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- SSL・HTTPS 掲示板サイトへの書き込みができない件(ブラウザソフトを変えてもできない) 2 2022/11/20 10:48
- その他(アニメ・マンガ・特撮) 著作権について アニメのオタ活手帳に貼るために、ワンシーンやキャラクターの立ち絵などを印刷したいです 3 2023/03/07 17:26
- ハッキング・フィッシング詐欺 インターネットに詳しい人、教えて オカズ探しにTwitterを回っていたら URLの書かれた画像にた 1 2022/04/10 00:03
- 高校 最近考えついた勉強方法についてご意見をいただきたいです。 私は文系の高校生で、将来英語を使った職に就 1 2023/02/04 21:28
- 大学受験 資格試験などの勉強で過去問題集の解説を理解する時、分からない用語を調べてどうするのが良いですか? 問 3 2023/06/18 17:18
- 大学受験 参考書の勉強法について質問なのですが、参考書を一通り終わらせて、二周目を行う際、問題だけ解けば良いで 2 2023/06/30 20:19
- Word(ワード) 改めての質問 3 2023/05/17 09:03
- 相続・遺言 自筆遺言書における不動産の表示の仕方 2 2022/04/19 10:43
- 行政学 過去問を中心とした勉強について 2 2022/06/01 19:44
- ネットワーク ネットワークの勉強について 4 2023/01/01 10:29
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
3重のクォーテーション
-
<div>を移動するには?
-
javascriptのエラーで質問です。
-
Q&A掲示板の入力フォームに文字...
-
エクセルで、日付を入力すると...
-
「ご処理進めて頂きますようお...
-
Excel VBAで他アプリケーション...
-
エクセルの画面にユーザーフォ...
-
エクセルVBAで、MsgBox やInput...
-
switch の範囲指定
-
UWSCの画像認識と条件分岐につ...
-
インタラクティブの反対語は?
-
ExcelVBAでユーザーフォーム内...
-
VBAでCOPYを繰り返すと、処理が...
-
VBA リストボックスをダブルク...
-
CloseとDisposeの違い
-
Accessのフォーム上にエクセル...
-
uwcs のマクロで画像認識をして...
-
uwscの画像認識の不具合だと思...
-
セックスレスの既婚女性は自慰...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
折りたたみを全て開いて別ペー...
-
確認ダイアログを次からは表示...
-
javascriptで複数の表示・非表...
-
特定の条件のHTML要素を一括で...
-
改行をしたいが、<br>と...
-
CSSでreadonlyの機能はあり...
-
macかwinか判別しスタイルシー...
-
SITEINFOの書き方について
-
ブラウザの表示領域から高さを...
-
vml フォントの大きさ変更
-
フォームで「パスワード(確認...
-
【JavaScript】検索がヒットし...
-
タイプライタ風の文字を真ん中...
-
jqueryを使ったスムーススクロ...
-
jQueryのCSSで値に変数を使う方法
-
webサイトに動画をはりつけ、ク...
-
年月日時分を指定してCSSを切り...
-
時間帯によってclass名を変更し...
-
2回目以降のページロード時には...
-
ブログパーツをレスポンシブ化...
おすすめ情報