我正在尝试从该表中抓取一些数据:https://sofifa.com/,但是在尝试从“值”列中提取信息时遇到了问题。我使用Mozilla开发工具来获取XPath选择器,该选择器对于“名称”和“总体评级”工作正常,但是对于Value,使用浏览器生成的XPath仅返回一个空列表。我正在使用Scrapy。
In [85]: value = response.xpath('/html/body/div[1]/div/div/div[1]/table/tbody/tr[1]/td[13]').extract()
In [86]: value
Out[86]: []
接下来我可以尝试什么?
答案 0 :(得分:0)
如果查看页面源代码,您会发现播放器的值在response.xpath('//*[@data-col="vl"]/text()').extract()
下,因此可以使用XPath提取它:
scrapy shell
为您提供表中的所有值。
要抓取页面,最好不要使用inspect元素给您的XPath,而要使用页面源代码,并尝试通过元素数据找到合适的XPath语句并在off
中对其进行测试。