xgboost和不平衡的数据集

时间:2019-10-03 20:08:44

标签: python machine-learning xgboost

如xgboost文档中所述,scale_pos_weight控制正权重和负权重的平衡,这对不平衡类很有用。在参数调整注释(https://xgboost.readthedocs.io/en/latest/tutorials/param_tuning.html)中指出,如果用户关心预测正确的概率,则无法完成数据集的重新平衡,并且需要将max_delta_step设置为有限数而不是0。

  1. 我想知道,如果我关心预测正确的概率,是否只需要 调整max_delta_step并使用默认值scale_pos_weight?还是我需要调整两个参数?

  2. xgboost还提供任何解决方案来处理极不平衡的数据集以进行回归预测(零值与正值1%对比99%)吗?

0 个答案:

没有答案