我正在像这样运行scrapy
scrapy crawl somespider -s JOBDIR=crawls/somespider-1 -a input_data=data
(用于维护作业状态)
当出现意外情况时(例如,连接丢失)
引发了一个CloseSpider异常,后来蜘蛛计划作为一个cron作业运行
我通常会将**kwargs
内的__init__
传递给新的蜘蛛抓取
然而{**}在{kwargs
中找不到JOBDIR
有什么方法可以从蜘蛛内部访问这个值吗?
答案 0 :(得分:0)
从蜘蛛内部:
self.crawler.settings.get("JOBDIR")