XPath:从类中检索文本

时间:2014-02-13 01:48:37

标签: python xpath lxml xpath-2.0 lxml.html

给出以下HTML字符串,由lxml解析:

<strong class="footer"> 
  <span class="icon-new"><i class="icon-new"/></span> 
  16 
</strong>

如何使用XPath提取数字 16

2 个答案:

答案 0 :(得分:2)

as&#39; 16&#39;文字位于strong标记下,您可以这样做:

>>> root = etree.fromstring(html)
>>> root.xpath('//strong[@class="footer"]/text()[normalize-space()]')[0].strip()
'16'

答案 1 :(得分:1)

使用纯Xpath

//strong[@class='footer']/normalize-space(text()[position()=last()])