使用聚类进行异常检测?

时间:2018-06-12 00:36:31

标签: machine-learning cluster-analysis anomaly-detection

根据Andrew Ng的课程讲座,异常检测算法之一是使用多元高斯来构建概率密度。

如果数据显示集群结构(不是单个块)怎么办?在这种情况下,我们是否采用无监督聚类来构建密度?如果是的话,该怎么办?是否存在其他系统方法来发现是否存在这种情况?

1 个答案:

答案 0 :(得分:1)

您可以使用常规GMM并使用阈值来识别异常值。不适合模型的点是异常值。

只要您的数据真的由高斯组成,这就可以了。

此外,群集相当昂贵。通常,直接使用非参数异常值模型(如KNN或LOF或LOOP)会更快。