是否有任何用于群集的预处理技术可以消除“隔离”#39;点?

时间:2017-03-01 09:35:57

标签: cluster-analysis

所以我希望群集的噪声数据。没有预先假设的簇数,我不希望孤立的噪声点导致更小的簇。我该如何删除它们?

感谢。

2 个答案:

答案 0 :(得分:1)

有DBSCAN和k-means等算法可以处理这些孤立的点,而不必删除它们。

答案 1 :(得分:0)

有两种方法可以解决这个问题。

  1. 您询问的方式 - 去除噪点 - 异常值。为此,您必须检测异常值。为此,您可以使用包Rlof中的lof函数计算Local Outlier Factor

  2. 使用专门识别噪音的聚类算法。我建议的那个是DBSCAN。您可以在名为dbscan的包中获得该算法的R实现。