Python:xpath从span中的元素中获取文本

时间:2014-11-06 22:20:27

标签: html xml python-2.7 xpath

我有以下HTML:

<span class="time" data-time="2014-11-06T22:00:00.000+0000">10'</span>

我正在使用这样的python代码:

import requests
from lxml import html

page=requests.get('http://www.url.com/data')
tree=html.fromstring(page.text)
empty=tree.xpath('//*[@id="stuff"]/div[1]/div[6]/div[1]/div/div/div/div[3]/span/text()')

我遇到的麻烦是,这会返回此特定元素的空列表。该元素是一个在网站上动态更新的计时器,它看起来不像text()调用正在做任何事情。

感谢任何帮助!

1 个答案:

答案 0 :(得分:1)

得到它:添加额外的&#39; /&#39;在text()调用之前。所以它读了,&#34; ... / div [3] / span // text()&#34;选择所有后代文本。花了很长时间搜索之后(在帖子之前,相信你我),我最终在这里找到了帮助Get text content of an HTML element using XPath?

我将在未来帮助其他人。