基于人工神经网络的Web客户端分类

时间:2010-12-08 19:24:26

标签: artificial-intelligence neural-network

我的网站流量很大。
我想创建一个软件,可以即时分析客户端请求,并决定它们是来自真实用户还是僵尸网络僵尸程序。为了训练神经网络识别合法(“好”)用户,我可以在没有DDoS活动时使用日志。一旦经过培训,网络就会将真实用户与机器人区分开来。

我有什么:

  • 请求URI(和订单)
  • 饼干
  • 用户代理
  • 请求频率。

关于如何为此任务最佳地设计ANN以及如何调整它的任何想法?

编辑:[回应关于此问题范围过宽的评论]

我目前有一个有效的C#程序,它根据相同请求的频率阻止客户端。现在我想用基于神经网络的分类器来改善其“智能”。
我不知道如何规范人工神经网络的这些输入,我需要在这一特定领域提出建议。

2 个答案:

答案 0 :(得分:1)

这不适合神经网络。提供神经网络(作为粗略指南):

  1. 您可以节省处理能力,
  2. 数据不是暂时的,
  3. 输入数据是有限的,
  4. 我不认为你真的通过了这些。

答案 1 :(得分:1)

Re:规范化输入:将输入数据映射到一组符号(然后将其转换为数字),或者将输入映射到浮点数,其中数字代表某种程度的强度。您可以将任何类型的数据映射到任何类型的方案,但是当问题解决方案是非线性时,您实际上只想使用ANN(另一个分类的一个分类的所有数据都不能聚集在一条线的一侧)该线另一侧的其他分类数据)。在这两种情况下,您最终得到一个与输出相关的输入向量([BOT,HUMAN]或[BOT,HUMAN,UNKNOWN]或[BOT,PROBABLY-BOT,ProBABLY-HUMAN,HUMAN]等)。

如何区分两个用户偶然及时提交完全相同的图书请求(让我们假设您正在销售图书)?