假设一个二进制分类器(例如一个随机森林)rfc
,我想计算AUC。我很难理解在计算中如何使用阈值。我了解您针对不同的阈值绘制了TPR / FPR图。我也理解阈值用作预测1类(否则为0类)的阈值,但是AUC算法如何预测类?
使用sklearn.metrics.roc_auc_score
说,您通过了y_true
和y_rfc
(是真实值和预测值),但是我看不到阈值在AUC分数/情节。
我已经阅读了有关AUC的不同指南/教程,但是他们关于阈值及其使用方法的所有解释都有些含糊。
答案 0 :(得分:0)
AUC曲线是基于不同阈值的TPR / FPR生成的。 ROC的要点是从(0; 1)采样阈值并获得曲线点。请注意,如果您的分类器是完美的,您将得到点(0,1),并且对于所有较小的阈值都不会最差,因此它也会在(0,1)上,导致auc = 1。
AUC不仅提供有关分类质量的信息,而且还提供有关如何评估分类器的置信度的信息。