xgboost:base_score参数的含义

时间:2017-12-01 15:24:54

标签: parameters xgboost

在xgboost的文档中,我读到了:

  

base_score [默认= 0.5]:所有人的初始预测分数   实例,全球偏见

这句话是什么意思?基准分数是数据集中感兴趣事件的先验概率吗?即在具有300个阳性和700个阴性的1,000个观察的数据集中,基础分数将为0.3?

如果不是,它会是什么?

您的建议将不胜感激。

1 个答案:

答案 0 :(得分:6)

我认为您的理解是正确的,在您的示例中,基本分数可以设置为0.3,或者您可以简单地将其保留为默认值0.5。对于高度不平衡的数据,您可以将其初始化为更有意义的基本分数,以改善学习过程。从理论上讲,只要您选择正确的学习率并给予足够的训练步骤,起始基础分数就不会影响结果。在this issue中查看作者的答案。

参考:https://github.com/dmlc/xgboost/issues/799