似乎scikitlearn的f1_score avg micro / macro(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html)基于多标签数据分类器,但我想知道是否可以将它用于多标签聚类?
我使用的数据是使用scikit的kmeans在50.000个时间序列(ts)上聚类的。所以我最终得到了以下形式的集群:c1 {ts_1,ts_2 ...},c2 {ts_20,ts_21 ...}等。
每个时间序列都可以有一个太多的标签,我想用它作为f1 avg微观和宏观分数的黄金标准。然后,簇的时间序列可以用其标签(L)代替:c1 {(L_1,L_2),(L_2),(L_2),(L_3,L_4,L_5)...}
可以将f1 avg微观和宏观分数应用于这样一个数据集的聚类,还是我应该看其他分数?
答案 0 :(得分:0)
没有。因为群集使用自己的"标签" (通常为0 ... k),并且与分类标签没有1对1匹配。
聚类只是一种分类。术语"无监督分类"这是非常误导的,因为差异可能非常大。这就是为什么群集中没有人似乎使用这个术语。
使用任何已建立的群集评估指标代替。