我在Java中使用Xerces。我想解析HTML文档以找到具有特定属性的div元素(例如,id = myID)。找到所述元素后,我想返回div中的文本内容。我无法在网上找到任何关于Xerces的例子。
示例:
<div id="myId">foo</div>
这应该返回foo。
答案 0 :(得分:1)
很抱歉这不能使用Xerces-J来回答,但是有一个名为jsoup的库就是为了这种事情而做的(虽然我确信Xerces也可以这样做)。它有点像Javascript for Java。 Jsoup允许你做这样的事情:
String html = "<div id=\"myId\">foo</div>";
Document doc = Jsoup.parse(html);
String divfoo = doc.getElementById("myId").text();
System.out.println(divfoo);
您怎么看?