应用错误收集

我正在构建一个基于python的网络爬虫，该爬虫从多个站点抓取产品的价格和规格数据。我要尊重他人，并尽可能多地关注robots.txt。

可以说，robots.txt文件中定义的抓取延迟为10秒。如何解释？我构建了刮板，以转到每个产品类别页面，然后获取每个类别中所有产品的列表，然后进入每个单独的产品页面，然后抓取价格和规格。

每个页面请求是否需要延迟10秒？还是运行脚本的行为曾经被视为一项操作，而我每次运行只需等待10s？

如果是前者，那么有人如何从站点中抓取大量数据？如果有5000个产品页面，而我将每个页面延迟10秒，那么我的脚本将需要14个小时才能运行一次。

如果我将工作分割成多个脚本怎么办？是每个单独的脚本都需要自己遵循规则，还是某个IP的所有请求都需要共同遵循该规则？

我不想禁止我的IP或意外删除任何人的站点。预先感谢您提供任何答案。