应用错误收集

时间：2017-11-13 10:48:59

标签： python scikit-learn cluster-analysis

似乎scikitlearn的f1_score avg micro / macro（http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html）基于多标签数据分类器，但我想知道是否可以将它用于多标签聚类？

我使用的数据是使用scikit的kmeans在50.000个时间序列（ts）上聚类的。所以我最终得到了以下形式的集群：c1 {ts_1，ts_2 ...}，c2 {ts_20，ts_21 ...}等。

每个时间序列都可以有一个太多的标签，我想用它作为f1 avg微观和宏观分数的黄金标准。然后，簇的时间序列可以用其标签（L）代替：c1 {（L_1，L_2），（L_2），（L_2），（L_3，L_4，L_5）...}

可以将f1 avg微观和宏观分数应用于这样一个数据集的聚类，还是我应该看其他分数？

答案 0 :(得分：0)

没有。因为群集使用自己的＆＃34;标签＆＃34; （通常为0 ... k），并且与分类标签没有1对1匹配。

聚类只是一种分类。术语＆＃34;无监督分类＆＃34;这是非常误导的，因为差异可能非常大。这就是为什么群集中没有人似乎使用这个术语。

使用任何已建立的群集评估指标代替。