scikit的f1_score的avg宏/微可以用于多标记聚类吗?

时间:2017-11-13 10:48:59

标签: python scikit-learn cluster-analysis

似乎scikitlearn的f1_score avg micro / macro(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html)基于多标签数据分类器,但我想知道是否可以将它用于多标签聚类?

我使用的数据是使用scikit的kmeans在50.000个时间序列(ts)上聚类的。所以我最终得到了以下形式的集群:c1 {ts_1,ts_2 ...},c2 {ts_20,ts_21 ...}等。

每个时间序列都可以有一个太多的标签,我想用它作为f1 avg微观和宏观分数的黄金标准。然后,簇的时间序列可以用其标签(L)代替:c1 {(L_1,L_2),(L_2),(L_2),(L_3,L_4,L_5)...}

可以将f1 avg微观和宏观分数应用于这样一个数据集的聚类,还是我应该看其他分数?

1 个答案:

答案 0 :(得分:0)

没有。因为群集使用自己的"标签" (通常为0 ... k),并且与分类标签没有1对1匹配。

聚类只是一种分类。术语"无监督分类"这是非常误导的,因为差异可能非常大。这就是为什么群集中没有人似乎使用这个术语。

使用任何已建立的群集评估指标代替。