Question

我想要做的是通过java解析xml。我只想要每个标签的一段文字。

xml示例

<data>\nSome Text :\n\MY Spectre around me night and day. Some More: Like a wild beast
guards my way.</data>

<data>\nSome Text :\n\Cruelty has a human heart. Some More: And Jealousy a human face
</data>

到目前为止，我有这个

NodeList ageList = firstItemElement.getElementsByTagName("data");
Element ageElement =(Element)ageList.item(0);
NodeList textAgeList = ageElement.getChildNodes();
out.write("Data : " + ((Node)textAgeList.item(0)).getNodeValue().trim());

我试图获得“更多：......”部分我不想要整个标签我也试图摆脱所有\ n

Answer 1

如果您不受标准DOM API的限制，可以尝试使用包含标准DOM的jOOX。您的示例将转换为：

// Use jOOX's jquery-like API to find elements and their text content
for (String string : $(firstItemElement).find("data").texts()) {

  // Use standard String methods to replace content
  System.out.println(string.replace("\\n", ""));
}

Answer 2

我将采用所有元素文本并使用正则表达式来捕获相关部分。

标记之间的java xml解析

2 个答案: