我想要做的是通过java解析xml。我只想要每个标签的一段文字。
xml示例
<data>\nSome Text :\n\MY Spectre around me night and day. Some More: Like a wild beast
guards my way.</data>
<data>\nSome Text :\n\Cruelty has a human heart. Some More: And Jealousy a human face
</data>
到目前为止,我有这个
NodeList ageList = firstItemElement.getElementsByTagName("data");
Element ageElement =(Element)ageList.item(0);
NodeList textAgeList = ageElement.getChildNodes();
out.write("Data : " + ((Node)textAgeList.item(0)).getNodeValue().trim());
我试图获得“更多:......”部分我不想要整个标签 我也试图摆脱所有\ n
答案 0 :(得分:1)
如果您不受标准DOM API的限制,可以尝试使用包含标准DOM的jOOX。您的示例将转换为:
// Use jOOX's jquery-like API to find elements and their text content
for (String string : $(firstItemElement).find("data").texts()) {
// Use standard String methods to replace content
System.out.println(string.replace("\\n", ""));
}
答案 1 :(得分:0)
我将采用所有元素文本并使用正则表达式来捕获相关部分。