应用错误收集

IP地址和机器人/垃圾邮件流量检测

时间：2014-10-06 19:32:30

标签： proxy ip subnet

我正在尝试使用会话ips列表检测应用程序的bot流量。

简单的解决方案是找到相同ips的出现，如果这些超过阈值，我们可以说该流量来自机器人。

我让自己思考并做了一些研究并且质疑：

来自单个IP的流量是否来自隐藏在子网或代理后面的多个用户？在哪种情况下绝对不是机器人？

（我也不太明白子网或代理是如何工作的，所以要温和。）

1 个答案:

答案 0 :(得分：0)

不仅仅是访问IP，而且可以从同一IP获取不同的访问者（特别是如果访问者使用拨号连接）

我抓住机器人的方式是从明显到可能的消除过程

如果userAgent为空
如果userAgent很短或不具描述性
如果userAgent包含一些明显的签名或流氓机器人我不想访问我的网站
如果访问者的平均综合浏览量停留在页面上的时间少于3秒机器人

在这种情况下我会反弹命中

然后不那么明显

我记录每次访问的ip，timestamp和userAgent，持续30分钟。并比较每次新访问池。

如果IP访问网站太快，很可能是机器人
如果IP使用不同的userAgent访问该站点可能是一个机器人

在这种情况下我预设验证码