什么是正确的XPath表达式?

时间:2016-11-26 20:19:51

标签: html xpath

从Wiki页面获取以下HTML:

<li>
  <a href="/wiki/Aluminium_bromide" title="Aluminium bromide">Aluminium bromide</a> – AlBr
  <sub>3</sub>
</li>

XPath表达式应该是什么,能够返回:

  

的AlBr 3

我试过了:

string(//li[/a = "Aluminium bromide"]//-)

但它只是返回一个错误。

1 个答案:

答案 0 :(得分:1)

由于节点嵌套的方式,这有点棘手。

但你可以说&#34; <li>中包含<a>的所有文字节点,其值为&#39;溴化铝&#39;,除了<a>的文本节点{ {1}}本身&#34;。

//li[a = 'Aluminium bromide']//text()[not(parent::a)]

然后进行一些后期处理(加入,修剪等)。