标签: python python-3.x web-scraping scrapy
我试图用Scrapy刮掉一个相当大的网站(大约有一百万页)。蜘蛛工作得很好,它能够刮掉几千页,然后由于内存不足而不可避免地崩溃。
我尝试的事情:
-s JOBDIR=<DIRECTORY>
我有什么遗漏可以帮助我完成刮擦吗?