如何计算投票集合分类器的AUC(曲线下面积)?

时间:2017-08-19 15:20:37

标签: machine-learning roc voting auc ensemble-learning

例如,我有3个阈值分类器c1,c2,c3和10个用于二进制分类的实例(标记为0/1),然后我可以得到形状(10,3)的得分矩阵S,S [i,j]是由第j个分类器给出的第i个实例的得分,当设置阈值时,我可以通过将得分与阈值进行比较来获得预测标签。

现在我使用c1,c2,c3整体的投票方法。据我所知,计算AUC值需要得到投票集合分类器给出的分数。但是在投票之后,只有预测的标签由集合分类器给出。在这种情况下如何计算AUC值?

1 个答案:

答案 0 :(得分:1)

正如您所说,AUC需要一个概率估计阈值。无论你如何创建你的模型 - 如果它是ensemlbe,重要的是你需要一个输出P(y | x)的模型。对于常规集合(每个成员具有相同的权重),它只是:

P(y|x) = 1/3 [ P1(y|x) + P2(y|x) + P3(y|x) ]

这就是你应用阈值处理(因此ROC / AUC基于它)。