Scrapy SgmlLinkExtractor如何获取span标签内的数字

时间:2016-09-20 14:40:13

标签: python regex xpath scrapy

如何在此特定位置突出显示整数:

number inside span tag

我从Google Chrome获得了以下XPath:

//*[@id="page"]/main/div[4]/div[2]/div[1]/div/div/div[2]/div[4]/div/div[1]/span

所以我使用srapy定义了以下XPath语句来检索数字:

id = response.xpath('//*[@id="page"]/main/div[4]/div[2]/div[1]/div/div/div[2]/div[4]/div/div[1]/span').extract()

但是变量id仍为空,我的蜘蛛似乎没有抓取任何信息。我应该如何重写语句才能访问这个特定元素?

1 个答案:

答案 0 :(得分:1)

通常,为了避免以后调试以获得稳定的运行,您需要避免使用绝对xpath或任何对页面结构的微小更改不灵活的xpath。

根据图片中提供的信息,您的xpath应为:

//*[@class='nr']/span

有关xpath规则的基本概述,您可以查看w3schools xpath selectors