我有一张由这张照片代表的数据集。
如您所见,其余数据点上方有一条细条。问题是如何使用聚类分析或任何其他技术将条带与其余条带分开。
我已经尝试过DBSCAN,KMeans和Hierarchical Clustering,所有这些都给了我类似的结果,在图中用颜色显示。
答案 0 :(得分:0)
DBSCAN和OPTICS是您最好的候选人。如果数据不是太大,您也可以尝试使用meanshift。但他们不能够完美地完成它 - 某些点对他们来说是“噪音”。 很明显,k-means和大多数层次聚类都无法解决这个问题。
保持minPts 小(5到10),并专注于选择epsilon。它必须小到足以不弥补差距。 OPTICS将更易于使用,因为您只需要给出epsilon的上限。
考虑手动指定模型。调整参数直到获得所需结果为不更好。使用标尺在绘图上画一条线,通过读取参数将其转换为线性模型...