我正在创建一个解析器,我使用表达式//html/body//div[@id='bodyContent']/s[1]
来获取带有标记<p>
的第一个节点。
但是如果我必须占用所有节点,我应该写什么表达式?
由于
答案 0 :(得分:2)
您想要提取ID为<p>
的div中的所有bodyContent
代码吗?
//html/body//div[@id='bodyContent']//p
或只是所有<p>
代码?
//p
例如,jaxen是一个很好的xpath库。您可以使用例如
List<Node> nodes = new DOMXPath("//p").selectNodes(document);
for (Node node : nodes) {
// do something with the matched nodes
node.getValue();
}