Question

我正在尝试从该表中抓取一些数据：https://sofifa.com/，但是在尝试从“值”列中提取信息时遇到了问题。我使用Mozilla开发工具来获取XPath选择器，该选择器对于“名称”和“总体评级”工作正常，但是对于Value，使用浏览器生成的XPath仅返回一个空列表。我正在使用Scrapy。

In [85]: value = response.xpath('/html/body/div[1]/div/div/div[1]/table/tbody/tr[1]/td[13]').extract()                                       
    
In [86]: value                                                                                                                               
Out[86]: []

接下来我可以尝试什么？

Answer 1

如果查看页面源代码，您会发现播放器的值在response.xpath('//*[@data-col="vl"]/text()').extract()下，因此可以使用XPath提取它：

scrapy shell

为您提供表中的所有值。

要抓取页面，最好不要使用inspect元素给您的XPath，而要使用页面源代码，并尝试通过元素数据找到合适的XPath语句并在off中对其进行测试。

XPath选择器返回一个空列表，而不是目标值

1 个答案: