调用聚类算法的精度曲线

时间:2017-05-28 06:30:14

标签: algorithm machine-learning cluster-analysis unsupervised-learning precision-recall

我想知道精确回忆曲线是否与聚类算法相关。例如,通过使用诸如Mean shift或DBSCAN之类的无监督学习技术(或者它仅与分类算法相关)。如果是,如何获得低召回值的绘图点?是否允许更改模型参数以获得模型的低召回率?

1 个答案:

答案 0 :(得分:0)

PR曲线(和ROC曲线)需要排名

E.g。分类器分数,可用于根据对A类的可能性对对象进行排名。

在群集中,您通常没有这样的排名。

如果没有排名,你就不会得到曲线。此外,群集中的精确度和召回率是多少?使用ARI和NMI进行评估。

但是存在诸如异常值检测之类的无监督方法,其中例如ROC曲线是相当常见的评估方法。 PR曲线更成问题,因为在0处它没有定义,ton不应该线性插值。因此,对于PR曲线,流行的“曲线下面积”没有很好地定义。由于还有十几种其他措施,因此我会避免使用PR-AUC。