Scrapy错误:' NotSupported:不支持的URL方案'':没有可用于该方案的处理程序'

时间:2017-04-03 20:38:36

标签: web-scraping scrapy scrapy-spider scrapy-shell

我正在尝试废弃网站,但在运行脚本时,我收到了以下错误

  

' NotSupported:不支持的网址方案'':没有可用的处理程序   那个计划'

如果规则没有错,为什么会出现这种情况以及您的建议是什么,请帮助我。非常感谢。

代码在这里:

from scrapy.spiders import CrawlSpider, Rule, BaseSpider
from scrapy.linkextractors import LinkExtractor 
class FellowSearch(CrawlSpider):
    name ='fellow'
    allowed_domains = ['emma.cam.ac.uk']
    start_urls = [' https://www.emma.cam.ac.uk/']

    rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),)

    def parse_obj(self, response):
        print response.url

1 个答案:

答案 0 :(得分:2)

您需要在start_urls更改为start_urls = ['https://www.emma.cam.ac.uk/']之前删除https之前的空格。