如何找到k均值聚类算法的准确性

时间:2019-03-27 06:24:40

标签: unsupervised-learning

我正在使用k-means聚类对未标记数据进行无监督学习,我没有任何可用的训练数据。如何测量算法的准确性?如何验证我获得的结果?

1 个答案:

答案 0 :(得分:0)

我想告诉您的是,群集没有确切数目,但是有一些验证方法。

首先,您可以在集群中的元素之间使用相似度计算,包括:

  • 皮尔逊相关系数
  • 欧几里得距离
  • 或余弦相关

此外,通过使用以下命令,您可以看到群集之间是否确实分开了:

  • 单联动
  • 完全链接
  • 或平均链接

邓恩指数,兰德指数或纯度也是评估聚类结果的不错选择。