我应该对给定域每秒执行的最大并发连接数/ HTTP请求数是多少?

时间:2013-01-22 09:43:01

标签: http web connection web-crawler httprequest

我从各种网络服务器下载了一个完整的目录静态图片内容(百万+图片,全部合法)。

我想有效地下载图片,但我正在考虑每个域有什么限制我应该放在#并发连接时间连接尝试之间,以避免被DOS工具和其他限制因素列入黑名单。

1 个答案:

答案 0 :(得分:0)

我需要寻找的关键词是“网络抓取器礼貌”,它出现了一些非常有用的文章来回答这个问题:

Typical politeness factor for a web crawler?

http://blog.mischel.com/2011/12/20/writing-a-web-crawler-politeness/