如xgboost文档中所述,scale_pos_weight
控制正权重和负权重的平衡,这对不平衡类很有用。在参数调整注释(https://xgboost.readthedocs.io/en/latest/tutorials/param_tuning.html)中指出,如果用户关心预测正确的概率,则无法完成数据集的重新平衡,并且需要将max_delta_step
设置为有限数而不是0。
我想知道,如果我关心预测正确的概率,是否只需要 调整max_delta_step
并使用默认值scale_pos_weight
?还是我需要调整两个参数?
xgboost还提供任何解决方案来处理极不平衡的数据集以进行回归预测(零值与正值1%对比99%)吗?