java k-means使用距离矩阵进行聚类

时间:2013-06-11 16:52:09

标签: matrix distance cluster-analysis k-means term

我正在使用k-means和NGD(标准化Google距离)进行术语聚类。 我有一个距离矩阵作为k-means算法的输入。 在这种情况下可以运行k-means吗?你能推荐任何源代码吗?

提前谢谢你,

纳斯

2 个答案:

答案 0 :(得分:1)

K-means 不能与距离矩阵一起使用。

因为它从不计算/使用点对点的相似性! (另外,它可以用这种方式在不到二次的时间内运行......)

相反,它计算将对象分配给聚类质心的方差贡献(从技术上讲,这是欧几里德距离点到中心的平方;但你不应该实际上插入其他距离。)而且,由于质心移动,你无法预先计算这些距离。

然而,存在没有这种限制的k-means的变种,特别是K-medoids aka PAM(在维基百科上查找)。这些不使用聚类中心,而是使用medoids(因此名称),它们是数据集的点。

答案 1 :(得分:-1)

你可以在这里使用WEKA-MEANS我发现something

您可以下载该项目以查看源代码here