导入scrapy 来自multiple_pages.items import YieldItem
7+0.4+0+1.6 = 9
)
class YelpSpider(scrapy.Spider):
name = "yelp"
allowed_domains = ["yelp.com"]
start_urls = ('http://www.yelp.com/'
答案 0 :(得分:1)
当您在XPath中使用//
时,它会从当前节点中选择与选择匹配的文档中的所有节点,无论它们位于何处。所以我想你选择几个文本字段。
尝试使用更具体的内容,例如:
item['phonenumber'] = response.xpath('//span[@class="biz-phone"]/text()').extract()