我无法抓取yelp.com上的电话号码

时间:2015-12-23 12:50:45

标签: python scrapy

  1. 导入scrapy     来自multiple_pages.items import YieldItem

    7+0.4+0+1.6 = 9
    • 列表项

    class YelpSpider(scrapy.Spider):
          name = "yelp"
          allowed_domains = ["yelp.com"]
          start_urls = ('http://www.yelp.com/'
    

1 个答案:

答案 0 :(得分:1)

当您在XPath中使用//时,它会从当前节点中选择与选择匹配的文档中的所有节点,无论它们位于何处。所以我想你选择几个文本字段。

尝试使用更具体的内容,例如:

item['phonenumber'] = response.xpath('//span[@class="biz-phone"]/text()').extract()