如何从已解析的html文档中选择给定索引的特定元素。
例如: ...
<div>div1</div>
<div>div2</div>
我想选择第二个div
,但在我看来,GPath不提供像Xpath那样的解决方案。
答案 0 :(得分:7)
def html = """
<html>
<head>
<title>test</title>
</head>
<body>
<div>div1</div>
<div>div2</div>
</body>
</html>"""
def xml = new XmlSlurper().parseText(html)
assert xml.body.div[0].text() == "div1"
assert xml.body.div[1].text() == "div2"
您还可以在div节点上使用集合类型方法,例如.each / .find,例如:
xml.body.div.find { it.text() == "div2" }
编辑:
为了澄清我的答案,给定HTML与上面列出的示例结构相同但有各种内容,您总是可以使用数组索引1访问第二个div:
xml.body.div[1]