当并非所有点都在聚类中时聚类点

时间:2019-01-27 20:41:35

标签: cluster-analysis k-means

我在下面绘制了一组坐标。我想将重叠的点(用红色圈出的点)聚集在一起,但是,我希望所有其他不重叠的点(不用红色圈出的点)被忽略。我不能使用K-means聚类,因为那样会聚类所有点,包括那些我想忽略的点。我想知道我该怎么做。谢谢

所需的输出:

enter image description here

输入:

enter image description here

1 个答案:

答案 0 :(得分:1)

不仅有k均值。如果您只考虑k-均值,那么您将错过50年的研究。

例如,DBACAN具有不属于任何群集的噪声点的概念。

但是,就您而言,您实际上并不是在寻找集群。

相反,您想执行相似性自联接。因为据我所知。您要匹配点的。这是一种特殊的联接。没有标准语法,但是可以将其视为SELECT a.p, b.p FROM data AS a JOIN data AS b WHERE distance(a.p, b.p) < threshold