如果数据只有一个类,我们如何通过聚类方法找到异常值?

时间:2017-11-01 17:14:27

标签: r cluster-analysis outliers

我想通过群集找到数据中的异常值。我的意思是在聚类之后,最远的样本被认为是异常值。我发现我的数据只有一个类,所以通过这种方式,聚类可以帮助找到异常值,还是有其他方法可以在数据只有一个类时找到异常值?

1 个答案:

答案 0 :(得分:1)

为什么不使用不需要群集或类的LOF(Local Outlier Factor)等专用离群值检测方法?

ELKI(可能是异常值检测的标准工具)已经超过了十几种异常值检测方法。包括一些基于聚类的方法(如你所建议的那样),虽然我不认为这些方法与专用方法一样好。