我有一个类别不平衡的二进制分类问题(80%的1级,20%的2级)。我用weight_column来平衡效果很好。 我唯一的问题是为什么这也会影响estimator.evaluate()方法?我希望唯一受影响的评估值是precision_baseline。
我对同一模型进行了两次评估,第一次是像训练中那样设置weight_column,第二次是将weight_column设置为1.0。结果如下:
weight_column与训练中相同
{'accuracy':0.881877,'accuracy_baseline':0.5110572,'auc': 0.9571304,'auc_precision_recall':0.9640416,'average_loss':0.26740322,'label / mean':0.5110572,'loss':0.43359837,'precision':0.94018126,'prediction / mean':0.48013598,'recall':0.82110816,'global_step ':1716}
weight_column设置为1.0
{'accuracy':0.9196458,'accuracy_baseline':0.79282826,'auc': 0.9571304,'auc_precision_recall':0.9023722,'average_loss':0.22132985,'label / mean':0.20717175,'loss':0.22132985,'precision':0.7971311,'prediction / mean':0.27698752,'recall':0.82110816,'global_step ':1716}
我很好奇为什么精度和召回率等数值会受到影响?