我是XGBoost的新手。因此,如果我的问题不值得尝试,请原谅。我试图了解XGBoostRegressor背后的工作逻辑和数学。
我有三个问题:
如何选择最佳功能和分割? (我知道Greedy方法,但我想了解加权分位数方法,以获取海量数据时的效率)
在XGBoostRegressor中构造的决策树的叶节点中存在哪些值?
如何计算最终预测值? 是(目标列的平均值)+(树0的值)+(树1的值)+ .....等,还是其他?
我已经为回归问题训练了模型,但不幸的是,我无法弄清楚预测值与决策树中的叶节点值之间的关系。我已经打印了一个决策树,但是我不会得出结论。
我尝试阅读https://arxiv.org/abs/1603.02754上的研究论文,但是对于像我这样的初学者来说,理解起来太复杂了。
请帮助我!