python中的Xpath没有获取数据

时间:2017-12-27 19:39:18

标签: python html xpath

我试图使用xpath在python中从维基百科请求数据。 我得到一个空列表。我做错了什么。

import requests

from lxml import html

pageContent=requests.get(
     'https://en.wikipedia.org/wiki/List_of_Olympic_medalists_in_judo'
)

tree = html.fromstring(pageContent.content)

name = tree.xpath('//*[@id="mw-content-text"]/div/table[1]/tbody/tr[2]/td[2]/a[1]/text()')

print name

1 个答案:

答案 0 :(得分:2)

尝试从浏览器和xpath标记获取table时,这是一个非常常见的错误,因为浏览器通常会在其中添加tbody标记,它实际上并不存在于响应体内。

所以只需将其移除即可:

'//*[@id="mw-content-text"]/div/table[1]//tr[2]/td[2]/a[1]/text()'