标签: scrapy
我的scrapy脚本的规则如下:
rules = (Rule(LinkExtractor(allow=(), restrict_xpaths=<xpath for next page>), callback=parse_website, follow= True, ),)
网站本身有一个导航,但每个页面只显示下一页的链接。即当第1页加载时,我可以获得第2页的链接,依此类推。
如何让我的蜘蛛浏览所有n个页面?
谢谢!