JavaでのXMLデータ抽出について

Question

いつも、お世話になります。以前、Perlでも似たような質問をさせていただきましたが、結局、Javaで作ることになりました。ところが、以下の現象が発生して困っております。プログラムは、下記のXmlファイルを読み込ませ"★"の部分を抽出してくるというプログラムです。読み込んだ結果として、次のようなものが欲しいとすると、 memoNumber = Class_A MemoNumber = 53 memoNumber = Class_B MemoNumber = 67 ：実際には、以下のようになってしまいます。 memoNumber = Class_A MemoNumber = 53 memoNumber = Class_A MemoNumber = 42 ：つまり、"memoNumber"の最初の要素しか見ておらず、次の"MemoNumberList"以下のタグ内を探しに行ってしまうようです。そこまでは分かったのですが対処法法が分かりません。読み込ませたいXMLファイルは以下のとおりです(データ数が膨大になるので一部省略をしています) ★ 1 ★ 345.9886776 ★ 53★ 67★ 88★ 00★ 32★ ★ 42★ 90★ 101★ 978★ 21★ ★ 10★ 1★ 11★ 99★ 66 15 Javaのソースは以下のとおりです。 import javax.xml.parsers.*; import org.w3c.dom.*; import java.io.*; public class MemoBlecks { public static void main(String[] args) { try { DocumentBuilderFactory dbfactory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = dbfactory.newDocumentBuilder(); Document doc = builder.parse(new File("MemoBlock.xml")); Element root = doc.getDocumentElement(); System.out.println("ルート要素のタグ名：" + root.getTagName()); System.out.println("***** 値リスト *****"); System.out.println("要素：memoNumberList"); System.out.println("値：MemoNumberList"); NodeList list = root.getElementsByTagName("MemoNumberList"); for (int i=0; i < list.getLength() ; i++) { Element element = (Element)list.item(i); String MemoNumber = element.getAttribute("memoNumber"); NodeList MemoNumberList =　element.getElementsByTagName("MemoNumber"); Element MemoNumberElement = (Element)MemoNumberList.item(0); String MemoNumber = MemoNumberElement.getFirstChild().getNodeValue(); System.out.println("memoNumber="+memoNumber); System.out.println("MemoNumber="+MemoNumber); } } catch (Exception e) { e.printStackTrace(); System.out.println("このウィンドウ上で次の操作を実行してください..."); System.out.println("「右クリック→すべて選択→右クリック→テキストエディタを開き、evaluation.txtとして保存」"); } } } 開発環境は次のとおりです。 OS：WindowsXP HomeEdition SP2 Java：JDK1.6.0_04 Javaに関しては初心者レベルの知識しかありません。そのため、載せたものも少々おかしいですが、どなたかご教授のほどお願い致します。

auty · Accepted Answer

すでに指摘のあるように、ｘｍｌファイルが間違って抽出されているようです。プログラムを拝見しますと、データが2重になっているのにその対処がなされていません。つまり ------------------------------------ 複数のタグに対して複数のタグがあります。 ------------------------------------ これに対して2重のループで処理する必要があります。次に処理の方法を簡単に挙げてみますので、参考にしてみてください。 -------------------------------------------------------------------- NodeList list = root.getElementsByTagName("MemoNumberList"); for (int i = 0; i < list.getLength(); i++) { Element element = (Element) list.item(i); // String MemoNumber = element.getAttribute("memoNumber"); System.out.println("要素：memoNumberList(" + i + ") ==================="); NodeList MemoNumberList = element .getElementsByTagName("MemoNumber"); for (int j = 0; j < MemoNumberList.getLength(); j++) { Element el = (Element) MemoNumberList.item(j); String memoNumberClass = el.getAttribute("memoNumber"); String memoNumber = el.getFirstChild().getNodeValue(); System.out.println("memoNumberClass=" + memoNumberClass); System.out.println("MemoNumber=" + memoNumber); } } --------------------------------------------------------------------

_ranco_ · Answer

基本的に、そのxmlは不正なので、パーサは扱えません。タグは、で閉じてください。

JavaでのXMLデータ抽出について

すでに指摘のあるように、ｘｍｌファイルが間違って抽出されているようです。

基本的に、そのxmlは不正なので、パーサは扱えません。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング