应用错误收集

用K-means确定簇标签

时间：2014-05-23 10:06:40

标签： cluster-analysis data-mining k-means

我的数据集包含150个实际分为3组的数据。每个小组都有自己的标签。

我使用K-means算法进行聚类过程以对数据进行分组。

我需要分配由K-means流程创建的每个组的标签。所以我可以将K-means的结果与数据训练进行比较。

任何人都可以帮忙解释如何确定每个组的标签？

1 个答案:

答案 0 :(得分：0)

阅读维基百科中的cluster evaluation。

没有聚类算法会将诸如iris_setosa之类的标签分配给群集，除非您以某种方式为聚类算法提供标签（但实际上它不再是聚类，而是分类）。

因此，您只能使用first_cluster，second_cluster，third_cluster类型的标签。

与原始数据集相比，提出了各种措施来比较集群的结构。但通常与原始标签不会有1：1的对应关系。