電子書籍の厳選無料作品が豊富!

以前、「ブログのHTMLからtrackback:pingを抽出したい」
http://oshiete1.goo.ne.jp/kotaeru.php3?q=1710072
の質問をしたものです。

前の質問でしたように、一般的なブログでは、trackback ping URLは、
ブログの記事のHTMLの中の、rdf:Description要素の中の、
trackback:pingのところに記述されています。

しかし、上記に当てはまらないブログもありました。

例えば、ヤプログやドリコムブログです。

これらのブログでは、HTML中でrdf:Description要素自体が記述されておらず、
以下のような形でtrackback ping URLが記述されています。

例)ヤプログ(trackback ping URLはhttp://yaplog.jp/example/tb_ping/22)

<html lang="ja">
<head>
<title>


<td width="5" background="/blog/template/37/img/entryl.gif"></td>
<td>
<table width="350" border="0" cellspacing="0" cellpadding="0">
<tr>
<td class="entry_text">
この記事へのトラックバックURL<br />
http://yaplog.jp/example/tb_ping/22<br><br>
<div class="comment_layer">

</div> 
</td>
</tr>
</table>
</td>
<td width="5" background="/blog/template/37/img/entryr.gif"></td>
</tr>
<tr>

</body>
</html>

このようなHTMLからtrackback ping URLである、
http://yaplog.jp/example/tb_ping/22を抽出したいです。

ブログの記事のURLを入力して、
そのブログの記事のtrackback ping URLを取得するには、
どのようにプログラムを組めばいいでしょうか?

よろしくお願いします。

A 回答 (1件)

ドリコムの場合、パターンマッチングを以下のようにすればいいかも・


(ヤプログは、現在メンテナンス中でテストできませんでしたが同じでいけるかと)
あとは、WEBサイトの切り分けをURLからやればいいと思います。
----------------------------------------------------------------
trackBackPing = Pattern.compile("http:.*\\/tb_ping\\/\\d+");
m = trackBackPing.matcher(aLine);
if(m.find()){
addr=aLine.substring(m.start(),m.end());
break;
}

この回答への補足

プログラムを動作させました。

無事TrackBackPingURLを抽出できました。

ありがとうございました。

補足日時:2005/10/17 22:09
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。

現在はプログラムを実行できる環境にいないので、
プログラムを動作させるまで評価の方はもうしばらくお待ちください。

ありがとうございました。

お礼日時:2005/10/15 23:26

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!