标签: machine-learning cluster-analysis anomaly-detection
根据Andrew Ng的课程讲座,异常检测算法之一是使用多元高斯来构建概率密度。
如果数据显示集群结构(不是单个块)怎么办?在这种情况下,我们是否采用无监督聚类来构建密度?如果是的话,该怎么办?是否存在其他系统方法来发现是否存在这种情况?
答案 0 :(得分:1)
您可以使用常规GMM并使用阈值来识别异常值。不适合模型的点是异常值。
只要您的数据真的由高斯组成,这就可以了。
此外,群集相当昂贵。通常,直接使用非参数异常值模型(如KNN或LOF或LOOP)会更快。