我要从此页面抓取地址:
http://calendar.youtoocanrun.com/events/chennai-1/kanchipuram-half-marathon-2018-3rd-edition/
当我编写此xpath时:
response.xpath('//span[@itemprop]/text()').extract()
我得到了期望的结果,即包含地址元素的列表:
[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']
但是当我编写这个xpath时:
response.xpath('//div[@class="geodir_more_info post_address"]//span[@itemprop]/text()').extract()
我得到一个空名单。
为什么?
答案 0 :(得分:1)
因为div
类之间有两个空格(geodir_more_info
和post_address
)。
输入:
response.xpath('//div[@class="geodir_more_info post_address"]/span[@itemprop]/text()').extract()
输出:
[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']