downloader / exception_type_count / scrapy.exceptions.IgnoreRequest

时间:2018-08-13 07:51:15

标签: exception scrapy web-crawler middleware scrapy-spider

我正在努力工作,可以抓取许多域。但是,在搜寻某些域时,我会遇到以下异常:

downloader/exception_type_count/scrapy.exceptions.IgnoreRequest

this is the terminal log:

我进行了搜索,结果表明我应该在设置中设置robots_obey = false。已设置,再次发生此异常! 任何想法?

1 个答案:

答案 0 :(得分:0)

不仅robotstxt中间件引发了IgnoreRequest。最有可能是RedirectMiddleware在达到最大值时提高IgnoreRequest。重定向,这对于具有循环重定向的页面来说很常见。