分类 - 1999年KDD-Cup和DARPA 1998/99公共入侵检测数据集

时间：2016-01-24 02:25:49

标签： machine-learning classification intrusion-detection

如何生成非常庞大的KDD-Cup 1999和DARPA 1998/99入侵检测公共数据集？谁知道他们用来分类和保持这些原始数据集的会话状态的软件工具？我的意思是，一旦您生成了网络数据，您如何将会话分类为anomalous (intrusion)和normal？是否有任何特殊的软件工具或机器可以做到这一点？

1 个答案:

答案 0 :(得分：2)

停止使用此数据集。

模拟，不现实。

现代攻击看起来不像他们在那里模拟的早期90年代的攻击，并且你可以使用普通过滤器检测这些攻击，无需使用机器学习。

此数据集has a bad reputation in the ML community：

因此，我们强烈建议（1）所有研究人员停止使用KDD Cup＆＃99; 99数据集，（2）KDD Cup和UCI网站包括对KDD的警告Cup＆＃99; 99数据集网页告知研究人员数据集存在已知问题，（3）会议和期刊的同行评审人员（或甚至完全拒绝他们，如网络安全社区中常见的那样）并绘制结果仅来自KDD Cup＆＃99; 99数据集。

无论您使用此合成数据集做什么 - 它都是无用的。

除此之外，请阅读数据文档。如果你碰巧在某个地方仍然有一台SunOS（现在的Oracle）计算机，它们似乎使用了BSM ......