Scrapy FormRequest卡住了

时间:2016-02-22 10:26:45

标签: javascript parsing scrapy

我正在尝试抓取多个网址,并为每个网址抓取几个页面,并为每个网页抓取几个项目。页面更改通过FormRequest执行。 我的蜘蛛看起来像这样:

def parse_url(self, response):
     for url in url_list:
         yield scrapy.Request(url,callback=self.parse_page)

def parse_page(self, response):
     for page in page_list:
         yield scrapy.FormRequest(url,formdata=data, callback=self.parse_item)

def parse_item(self, response):
    for item in item_list:
         yield item

我期待Scrapy按以下顺序抓取:

  • url1 - page1:获取所有项目
  • url1 - page2:获取所有项目
  • url1 - page3:获取所有项目
  • url2 - page1:获取所有项目
  • url2 - page2:获取所有物品.....

但Scrapy卡在列表中的最后一个网址上,并不断更改该网址的页面。

非常感谢任何帮助。 谢谢

0 个答案:

没有答案