Scrapy + Python + Xpath:总是无法刮擦数据点

时间:2018-09-21 08:32:44

标签: python xpath scrapy web-crawler

我要从此页面抓取地址:

http://calendar.youtoocanrun.com/events/chennai-1/kanchipuram-half-marathon-2018-3rd-edition/

enter image description here

当我编写此xpath时:

response.xpath('//span[@itemprop]/text()').extract()

我得到了期望的结果,即包含地址元素的列表:

[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']

但是当我编写这个xpath时:

response.xpath('//div[@class="geodir_more_info post_address"]//span[@itemprop]/text()').extract()

我得到一个空名单。

为什么?

1 个答案:

答案 0 :(得分:1)

因为div类之间有两个空格(geodir_more_infopost_address)。

输入:

response.xpath('//div[@class="geodir_more_info  post_address"]/span[@itemprop]/text()').extract()

输出:

[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']