Question

我正在尝试废弃网站，但在运行脚本时，我收到了以下错误

＆＃39; NotSupported：不支持的网址方案＆＃39;＆＃39;：没有可用的处理程序那个计划＆＃39;

如果规则没有错，为什么会出现这种情况以及您的建议是什么，请帮助我。非常感谢。

代码在这里：

from scrapy.spiders import CrawlSpider, Rule, BaseSpider
from scrapy.linkextractors import LinkExtractor 
class FellowSearch(CrawlSpider):
    name ='fellow'
    allowed_domains = ['emma.cam.ac.uk']
    start_urls = [' https://www.emma.cam.ac.uk/']

    rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),)

    def parse_obj(self, response):
        print response.url

Answer 1

您需要在start_urls更改为start_urls = ['https://www.emma.cam.ac.uk/']之前删除https之前的空格。

Scrapy错误：＆＃39; NotSupported：不支持的URL方案＆＃39;＆＃39;：没有可用于该方案的处理程序＆＃39;

1 个答案: