我试图在scrapinghub上运行一个scrapy蜘蛛,我想传递一些数据。我正在使用他们的API运行蜘蛛:
http://doc.scrapinghub.com/api/jobs.html#jobs-run-json
他们有job_settings
的选项,这看似相关,但我无法弄清楚如何访问job_settings
课程中的Spider
数据。这里的正确方法是什么?
答案 0 :(得分:4)
此job_settings
应直接合并到Scrapy settings,优先级更高(40
,IIRC)。
可以通过蜘蛛实例的.settings
属性访问Scrapy设置,例如如果self.settings
是self
个实例,则可以使用scrapy.Spider
。