如何生成非常庞大的KDD-Cup 1999和DARPA 1998/99入侵检测公共数据集?谁知道他们用来分类和保持这些原始数据集的会话状态的软件工具?我的意思是,一旦您生成了网络数据,您如何将会话分类为anomalous (intrusion)
和normal
?是否有任何特殊的软件工具或机器可以做到这一点?
答案 0 :(得分:2)
模拟,不现实。
现代攻击看起来不像他们在那里模拟的早期90年代的攻击,并且你可以使用普通过滤器检测这些攻击,无需使用机器学习。
此数据集has a bad reputation in the ML community:
因此,我们强烈建议(1)所有研究人员停止使用KDD Cupc 99数据集,(2)KDD Cup和UCI网站包括对KDD的警告Cupc 99数据集网页告知研究人员数据集存在已知问题,(3)会议和期刊的同行评审人员(或甚至完全拒绝他们,如网络安全社区中常见的那样)并绘制结果仅来自KDD Cupc 99数据集。
无论您使用此合成数据集做什么 - 它都是无用的。
除此之外,请阅读数据文档。如果你碰巧在某个地方仍然有一台SunOS(现在的Oracle)计算机,它们似乎使用了BSM ......