我在下面绘制了一组坐标。我想将重叠的点(用红色圈出的点)聚集在一起,但是,我希望所有其他不重叠的点(不用红色圈出的点)被忽略。我不能使用K-means聚类,因为那样会聚类所有点,包括那些我想忽略的点。我想知道我该怎么做。谢谢
所需的输出:
输入:
答案 0 :(得分:1)
不仅有k均值。如果您只考虑k-均值,那么您将错过50年的研究。
例如,DBACAN具有不属于任何群集的噪声点的概念。
但是,就您而言,您实际上并不是在寻找集群。
相反,您想执行相似性自联接。因为据我所知。您要匹配点的对。这是一种特殊的联接。没有标准语法,但是可以将其视为SELECT a.p, b.p FROM data AS a JOIN data AS b WHERE distance(a.p, b.p) < threshold
。