scrapy项目导出器是否支持优先级?如果有,怎么样?

时间:2013-10-09 03:12:23

标签: python-2.7 screen-scraping scrapy

通过支持优先级,我的意思是当您从项目管道中弹出一个项目时,它返回一个具有最高优先级的项目。

1 个答案:

答案 0 :(得分:1)

也许你可以自己定制。

pipelines.py

class PriorityPipeline(object):
    def __init__(self):
        self.ids_seen = set()
    def process_item(self, item, spider):
        if item['id'] in self.ids_seen:
            raise DropItem("Duplicate item found: %s" % item)
        else:
            self.ids_seen.add(item['id'])
            return item

settings.py

ITEM_PIPELINES = [
    'soufun.pipelines.PriorityPipeline',
]