我正在使用k-means和NGD(标准化Google距离)进行术语聚类。 我有一个距离矩阵作为k-means算法的输入。 在这种情况下可以运行k-means吗?你能推荐任何源代码吗?
提前谢谢你,
纳斯
答案 0 :(得分:1)
K-means 不能与距离矩阵一起使用。
因为它从不计算/使用点对点的相似性! (另外,它可以用这种方式在不到二次的时间内运行......)
相反,它计算将对象分配给聚类质心的方差贡献(从技术上讲,这是欧几里德距离点到中心的平方;但你不应该实际上插入其他距离。)而且,由于质心移动,你无法预先计算这些距离。
然而,存在没有这种限制的k-means的变种,特别是K-medoids aka PAM(在维基百科上查找)。这些不使用聚类中心,而是使用medoids(因此名称),它们是数据集的点。
答案 1 :(得分:-1)