从Wiki页面获取以下HTML:
<li>
<a href="/wiki/Aluminium_bromide" title="Aluminium bromide">Aluminium bromide</a> – AlBr
<sub>3</sub>
</li>
XPath表达式应该是什么,能够返回:
的AlBr 3
我试过了:
string(//li[/a = "Aluminium bromide"]//-)
但它只是返回一个错误。
答案 0 :(得分:1)
由于节点嵌套的方式,这有点棘手。
但你可以说&#34; <li>
中包含<a>
的所有文字节点,其值为&#39;溴化铝&#39;,除了<a>
的文本节点{ {1}}本身&#34;。
//li[a = 'Aluminium bromide']//text()[not(parent::a)]
然后进行一些后期处理(加入,修剪等)。