在Scrapy项目中使用多个蜘蛛

时间:2011-02-03 13:51:58

标签: scrapy

我想知道是否可以在同一个项目中同时使用多个蜘蛛。其实我需要2只蜘蛛。第一个收集第二个蜘蛛应该刮的链接。他们都在同一个网站上工作,所以域名是相似的。这可能吗?如果是,你能举个例子吗? 感谢

1 个答案:

答案 0 :(得分:12)

也许这就是你要找的东西:

def parse(self, response):
    # parse the links (aka your first spider)
    for link in hxs('//XPATH'):
        yield Request(link.extract(), callback=self.parse_link)

def parse_link(self, response):
    # continue parsing (aka your second spider)

希望这可以帮到你:)