使用ELKI MiniGUI进行异常检测,包括训练集和测试集

时间:2015-02-19 16:12:56

标签: machine-learning weka supervised-learning unsupervised-learning elki

我有:

  1. 文件training.arff,其中仅包含具有正常行为的样本。

  2. 文件test.arff,其中包含正常和异常行为的样本。

  3. 我想使用ELKI MiniGUI进行半监督学习的异常检测。

    我认为通常我应该使用training.arff构建/训练模型,然后在test.arff上应用模型。

    我使用哪种算法并不重要。

    我似乎无法找到将这两个文件放在ELKI MiniGUI中的位置,这样我就能得到我想要的结果。 (只有dbc.in

    * PS:在尝试使用weka一周后,我放弃了,但我不仅限于ELKI。

    谢谢!

1 个答案:

答案 0 :(得分:3)

您的方案是监督学习方法。

ELKI目前仅包含无监督离群值检测方法,它们不使用“仅正常”训练数据的先验信息。

您可以将训练和测试文件连接到一个文件中,然后运行异常值检测。此域中大多数已发布的算法都是无监督的。在无监督学习中,没有训练数据集 - 只有一种数据。

请注意,截至2014年,ELKI中提供的大多数算法都是针对数字数据而设计的。如果您的数据是分类的,您将能够使用其中的许多数据,但您需要实现适合您的数据类型的数据类型和距离函数。有一些解析器和距离可用于非数字数据(例如,用于文本数据),但ARFF解析器不支持此功能,并且当前也没有混合数据的距离函数。