Question

我在Java中使用Xerces。我想解析HTML文档以找到具有特定属性的div元素（例如，id = myID）。找到所述元素后，我想返回div中的文本内容。我无法在网上找到任何关于Xerces的例子。

示例：

<div id="myId">foo</div>

这应该返回foo。

Answer 1

很抱歉这不能使用Xerces-J来回答，但是有一个名为jsoup的库就是为了这种事情而做的（虽然我确信Xerces也可以这样做）。它有点像Javascript for Java。 Jsoup允许你做这样的事情：

String html = "<div id=\"myId\">foo</div>";
Document doc = Jsoup.parse(html);
String divfoo = doc.getElementById("myId").text();
System.out.println(divfoo);

您怎么看？

如何使用Xerces-J？</div>找到具有特定属性值的<div>标记

1 个答案: