Question

蜘蛛代码：

struct cred

问题：即使下一个page_page和url存在且正确，蜘蛛也会在第一页之后停止。

以下是停止前的最后一条调试消息：

struct task_struct

Answer 1

您需要检查以下内容。

检查您尝试抓取的网址是否不是Robots.txt，您可以通过查看http://blabla.org/robots.txt找到该网址。默认情况下，scrapy服从robots.txt。 建议您遵守robots.txt
默认情况下，scrapy的下载延迟为0.25，您可以将其增加2秒或更多，然后尝试。

Answer 2

问题在于下一页的回复是对机器人的回复，并且不包含任何链接。