Question

我要从此页面抓取地址：

当我编写此xpath时：

response.xpath('//span[@itemprop]/text()').extract()

我得到了期望的结果，即包含地址元素的列表：

[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']

但是当我编写这个xpath时：

response.xpath('//div[@class="geodir_more_info post_address"]//span[@itemprop]/text()').extract()

我得到一个空名单。

为什么？

Answer 1

因为div类之间有两个空格（geodir_more_info和post_address）。

输入：

response.xpath('//div[@class="geodir_more_info  post_address"]/span[@itemprop]/text()').extract()

输出：

[u'Chennai', u'Chennai', u'Tamil Nadu', u'India']