在xgboost的文档中,我读到了:
base_score [默认= 0.5]:所有人的初始预测分数 实例,全球偏见
这句话是什么意思?基准分数是数据集中感兴趣事件的先验概率吗?即在具有300个阳性和700个阴性的1,000个观察的数据集中,基础分数将为0.3?
如果不是,它会是什么?
您的建议将不胜感激。
答案 0 :(得分:6)
我认为您的理解是正确的,在您的示例中,基本分数可以设置为0.3,或者您可以简单地将其保留为默认值0.5。对于高度不平衡的数据,您可以将其初始化为更有意义的基本分数,以改善学习过程。从理论上讲,只要您选择正确的学习率并给予足够的训练步骤,起始基础分数就不会影响结果。在this issue中查看作者的答案。