将网络刮板伪装成真正的客户端的技巧?

时间:2013-05-05 22:33:31

标签: python web-scraping beautifulsoup

我正在编写一个小型实验性应用程序,需要从许多网站上删除数据。

目前,我在后续请求和使用多个用户代理字符串之间添加了一个随机延迟(2-20秒)。 还可以做些什么来帮助网络刮刀逃避检测?

例如,设置referrer或x-forwarded-for标头是否有任何优势。

1 个答案:

答案 0 :(得分:0)

也许使用tor并更改其频率以更频繁地更新IP地址?