Question

我正在使用scrapy抓取一个网站，但发生了不好的事情（断电等）。

我想知道如何继续从破碎的地方爬行。我不想从种子开始。

Answer 1

这可以通过将计划的请求持久保存到磁盘来完成。

scrapy crawl somespider -s JOBDIR=crawls/somespider-1