Question

导入scrapy 来自multiple_pages.items import YieldItem

7+0.4+0+1.6 = 9

）

class YelpSpider(scrapy.Spider):
      name = "yelp"
      allowed_domains = ["yelp.com"]
      start_urls = ('http://www.yelp.com/'

Answer 1

当您在XPath中使用//时，它会从当前节点中选择与选择匹配的文档中的所有节点，无论它们位于何处。所以我想你选择几个文本字段。

尝试使用更具体的内容，例如：

item['phonenumber'] = response.xpath('//span[@class="biz-phone"]/text()').extract()