我正在尝试废弃网站,但在运行脚本时,我收到了以下错误
' NotSupported:不支持的网址方案'':没有可用的处理程序 那个计划'
如果规则没有错,为什么会出现这种情况以及您的建议是什么,请帮助我。非常感谢。
代码在这里:
from scrapy.spiders import CrawlSpider, Rule, BaseSpider
from scrapy.linkextractors import LinkExtractor
class FellowSearch(CrawlSpider):
name ='fellow'
allowed_domains = ['emma.cam.ac.uk']
start_urls = [' https://www.emma.cam.ac.uk/']
rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),)
def parse_obj(self, response):
print response.url
答案 0 :(得分:2)
您需要在start_urls
更改为start_urls =
['https://www.emma.cam.ac.uk/']
之前删除https之前的空格。