我是机器学习的初学者。到目前为止,我已经看到算法几乎可以测量记录(众多字段)与数据集中其他记录(例如k-means)的不同。
我正在尝试应用一些ml网络入侵检测算法,但我认为这些算法可能不合适,因为它们将记录视为单个实体而不是记录环境中的记录(即遵循或遵循的记录)按具体记录)。例如,当存在于正常流量的记录中时,对应于同步分组的记录可能是正常的,但是如果该记录存在于许多其他同步记录中,那么我们可能正在处理同步洪泛攻击。这只是一个例子......我希望我能说清楚。
是否有任何具有此功能的算法?如果是这样,任何人都可以指点吗?
提前谢谢!
答案 0 :(得分:1)
您需要检查有状态的方法,例如隐马尔可夫模型或卡尔曼滤波器,这些方法确实会将控制文件纳入帐户。
或者,您可以创建前面值的长向量并使用它来推断上下文,但HMM是一般的方法,具有很多理论和实践优势。
答案 1 :(得分:0)
你在正确的地方。我认为你对分类算法很感兴趣,而不是聚类。
对您拥有的数据进行聚类可以为您提供有关哪些特征具有重要意义的想法。但它的分类允许您决定请求是否是敌对的。它与垃圾邮件过滤有更多共同之处。