为什么scrapy管道需要退货?

时间:2016-03-04 05:55:08

标签: python web-scraping scrapy

根据document,我们需要返回dictitem或提出DropItem例外。我知道如果用户使用JSON导出器可以使用它,但如果我构建了一个不使用scrapy导出器的MongoDB管道,那么返回项目的目的是什么?似乎scrapy输出返回到屏幕的任何内容,它确实使屏幕变得混乱。

1 个答案:

答案 0 :(得分:0)

如果您构建MongoDB管道,我认为您不需要返回任何dictitem。 mongo管道的简单代码是这样的:

class MongoPipeline(object):

    def open_spider(self, spider):
        #some code for mongo client connection

    def process_item(self, item, spider):
        self.col.insert(dict(item))