所以我希望群集的噪声数据。没有预先假设的簇数,我不希望孤立的噪声点导致更小的簇。我该如何删除它们?
感谢。
答案 0 :(得分:1)
有DBSCAN和k-means等算法可以处理这些孤立的点,而不必删除它们。
答案 1 :(得分:0)
有两种方法可以解决这个问题。
您询问的方式 - 去除噪点 - 异常值。为此,您必须检测异常值。为此,您可以使用包Rlof中的lof
函数计算Local Outlier Factor。
使用专门识别噪音的聚类算法。我建议的那个是DBSCAN。您可以在名为dbscan的包中获得该算法的R实现。