我必须从HTML文档中获取值,我不能使用完整的xpath表达式,因为如果原始文档发生更改,我的脚本会更容易受到攻击。这是html文件的样子:
<div id="wrapper">
<div class="block">
<div class="title">Kind:</div>
<div class="value">
<a href="http://google.com">Book</a>
</div>
...
</div>
</div>
获取Book
我需要做的是获取节点的a
子节点的内容,该节点的内容为Kind:
。是否可以使用单个xpath表达式完成?
答案 0 :(得分:1)
您可以使用此XPath:
//div[. = 'Kind:']/following-sibling::div/a/text()
它将选择div/a/text()
,其中div
位于内容Kind: