以前、「RSSからblog(ブログ)の本文を抽出したい」という質問をした者です。
http://oshiete1.goo.ne.jp/kotaeru.php3?q=1677591
以前ご教授いただいた方法でプログラムを作り、
javaのDOMを使ってRSSからブログの本文を抽出することができましたが、
(参考:http://www.hellohiro.com/xmldom.htm HelloWorldDOMPageList.java)
特定のブログのRSSからは本文のデータを取得することができませんでした。
例えば、exiteやFC2などのブログのRSSからはデータを取得することができませんでした。
リンクや、タイトルなどは問題なく取得できるのですが、
本文が記述されている要素(例えば、exiteならdescription,FC2ならcontent:encoded)
内のデータを取得しようとすると、プログラムの結果として、
何も取得できずに、空白となってしまいます。
ライブドアやヤフーなど他のブログのRSSでは成功したのですが…
何か問題があるのでしょうか?
よろしくお願いします。
No.1ベストアンサー
- 回答日時:
>何か問題があるのでしょうか?
何が問題で片方で取れて片方で取れないのか
ちょっとよくはわからないのですが、
とりあえず
NodeList contentList = element.getElementsByTagName("content:encoded");
Element contentElement = (Element)contentList.item(0);
String content = contentElement.getTextContent();
のようにgetTextContentを使ってみるとうまくいきました。
No.2
- 回答日時:
>何も取得できずに、空白となってしまいます。
の原因は、
ライブドアなどが
<content:encoded><![CDATA[
になっているのに対し、うまくいかない方は
<content:encoded>
<![CDATA[…
のように別の行になっていることが原因ですね。
改行が1つ入っているためにCDATAセクションの前にテキストノードが1つできていて、
content:encodedの最初のノードの内容を取り出すと空行しかないので値が取れないということだと思います。
対処としては#1でいいと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- gooブログ gooブログについて 1 2022/05/09 09:46
- WordPress(ワードプレス) ワードプレスのパーマリンク設定について 1 2023/02/11 19:08
- Visual Basic(VBA) 3つのプロシージャをまとめたら実行時エラー発生で対応不能 6 2022/05/17 01:47
- PHP phpのエラーについて 1 2022/06/27 22:30
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- FC2ブログ どうやるのか、さっぱり分かりません。ブログ引っ越したいと思っています(URLだけを変えたい)。 3 2022/12/01 07:40
- その他(ブログ) ブログについて質問です。私の本名を鈴木花子と仮定して「はなこブログ」を立ち上げて自分の今までの経験談 2 2022/09/19 20:06
- WordPress(ワードプレス) WordPress のブログを初期化したい。リスクは? 1 2023/01/01 05:47
- インターネットビジネス ChatGPTなどのAIで自動的にブログを生成する方法を教えてください 無料でできますか? 1 2023/08/18 16:32
- 確定申告 副業で複数個所からの所得と経費について 5 2022/05/05 16:39
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
CPUの考え方を教えてください ...
-
VB6.0ツリービューについて
-
あるノードリストに、特定の名...
-
XML文書の指定した属性値を持つ...
-
ノードとは
-
SNMP リンクダウンとノードダ...
-
昔Winnyってありましたけど、あ...
-
VB6.0でDOMを使用して...
-
同じタグ名の項目取得
-
c言語 ノードの連結
-
TreeViewのノードの編集結果が...
-
TreeViewで複数ノードの選択は...
-
TreeViewのNodeについて
-
TreeView の初期表示について
-
C言語 TreeViewのノードをプロ...
-
C#のツリービューでツリーノー...
-
ルート要素ノードが2個ある場合?
-
TreeView と DOMツリー
-
ノード数とは?
-
vbsのDOMDocumentで要素のText...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
CPUの考え方を教えてください ...
-
SNMP リンクダウンとノードダ...
-
同じタグ名の項目取得
-
昔Winnyってありましたけど、あ...
-
コンテキストメニュークリック...
-
ルート要素ノードが2個ある場合?
-
マスターノード
-
複数のマックPCによる数値計算...
-
あるノードリストに、特定の名...
-
TreeView の初期表示について
-
TreeViewの再表示のちらつきを...
-
ツリービューのノードをダブル...
-
C# TreeView 効率良いノード追...
-
ノード数とは?
-
XML文書の指定した属性値を持つ...
-
C#のツリービューでツリーノー...
-
VB6.0でDOMを使用して...
-
TreeViewで複数ノードの選択は...
-
ノードとは
-
VisualBasic.net(2008) ツリー...
おすすめ情報