在xpath中跟随兄弟姐妹返回空结果

时间:2014-02-06 22:47:46

标签: html xpath scrapy

我有这个html节点

<li>
    <em>Description
    </em>
    <br>
    TEXT TEXT                
</li>

我想提取Text Text

我试过了:

 sel.xpath('//em[normalize-space(.) = "Description"]/following-sibling::*')

我得到了空洞的结果。

为什么请?

请我检查说明,所以我希望你的答案不包括检查说明

2 个答案:

答案 0 :(得分:3)

我自己找到了解决方案,而且

'//li[contains(em,"Description")]/text()[last()]'

答案 1 :(得分:0)

这不是有效的XML。 <br>在哪里关闭?如果它是<br/>,则它将为空,因为以下兄弟是<br/>