我正在使用xgboost
来解决分类问题。
我有一个基本问题。
您可以在下面找到火车和测试(看不见)设置的每轮AUC。
正如您所看到的,测试集的AUC接近0.您能否帮助我了解正在发生的事情?
我正在使用python。
[0] test-auc:0.4375 train-auc:0.881865
[1] test-auc:0.25 train-auc:0.947957
[2] test-auc:0.166667 train-auc:0.982759
[3] test-auc:0.166667 train-auc:0.984674
[4] test-auc:0 train-auc:0.996169
[5] test-auc:0 train-auc:0.998723
[6] test-auc:0 train-auc:0.998723
[7] test-auc:0 train-auc:0.999361
[8] test-auc:0.041667 train-auc:1
[9] test-auc:0.041667 train-auc:1
[10] test-auc:0.041667 train-auc:1
[11] test-auc:0.041667 train-auc:1
[12] test-auc:0 train-auc:1
[13] test-auc:0 train-auc:1
答案 0 :(得分:2)
0
的AUC表示预测器正在为测试集中的所有样本预测错误的类。
查看训练集的AUC,它意味着测试集的大小太小,或者您选择了错误的(相反)类来绘制测试预测的AUC。