如何将薄条与其余数据分开

时间:2016-02-19 06:32:28

标签: cluster-analysis k-means hierarchical-clustering dbscan

我有一张由这张照片代表的数据集。 data

如您所见,其余数据点上方有一条细条。问题是如何使用聚类分析或任何其他技术将条带与其余条带分开。

我已经尝试过DBSCAN,KMeans和Hierarchical Clustering,所有这些都给了我类似的结果,在图中用颜色显示。

1 个答案:

答案 0 :(得分:0)

DBSCAN和OPTICS是您最好的候选人。如果数据不是太大,您也可以尝试使用meanshift。但他们能够完美地完成它 - 某些点对他们来说是“噪音”。 很明显,k-means和大多数层次聚类都无法解决这个问题。

保持minPts (5到10),并专注于选择epsilon。它必须小到足以弥补差距。 OPTICS将更易于使用,因为您只需要给出epsilon的上限。

考虑手动指定模型。调整参数直到获得所需结果为更好。使用标尺在绘图上画一条线,通过读取参数将其转换为线性模型...