Scrapy / Python:如何从蜘蛛内部获取JOBDIR设置?

时间:2015-08-29 09:59:35

标签: python scrapy

我正在像这样运行scrapy

scrapy crawl somespider -s JOBDIR=crawls/somespider-1 -a input_data=data

(用于维护作业状态)

当出现意外情况时(例如,连接丢失)

引发了一个CloseSpider异常,后来蜘蛛计划作为一个cron作业运行

我通常会将**kwargs内的__init__传递给新的蜘蛛抓取

然而{**}在{kwargs

中找不到JOBDIR

有什么方法可以从蜘蛛内部访问这个值吗?

1 个答案:

答案 0 :(得分:0)

从蜘蛛内部: self.crawler.settings.get("JOBDIR")