如何使用Xerces-J?</div>找到具有特定属性值的<div>标记

时间:2012-02-21 01:12:13

标签: html-parsing

我在Java中使用Xerces。我想解析HTML文档以找到具有特定属性的div元素(例如,id = myID)。找到所述元素后,我想返回div中的文本内容。我无法在网上找到任何关于Xerces的例子。

示例:

<div id="myId">foo</div>

这应该返回foo。

1 个答案:

答案 0 :(得分:1)

很抱歉这不能使用Xerces-J来回答,但是有一个名为jsoup的库就是为了这种事情而做的(虽然我确信Xerces也可以这样做)。它有点像Javascript for Java。 Jsoup允许你做这样的事情:

String html = "<div id=\"myId\">foo</div>";
Document doc = Jsoup.parse(html);
String divfoo = doc.getElementById("myId").text();
System.out.println(divfoo);

您怎么看?