非平衡数据中的ROC曲线

时间:2017-04-21 08:24:25

标签: python scikit-learn roc auc

我使用渐变增强分类器进行ovr分类来预测{0,1,2,3,4,5}中的目标值。数据的Majrotiy(2M样本)具有{0,1}中的目标值,少数数据(97K样本)具有{2,3,4,5}中的目标值。我根据Scikit example绘制了ROC曲线。如图所示,少数民族的AUC = 0.99。我想知道分类器的性能是高还是不平衡数据的影响?

enter image description here更新 如果我选择在{2,3,4,5}中具有目标值的样本,则ROC曲线将如下所示: enter image description here

0 个答案:

没有答案