在xgboost回归器中为决策树解释graphviz输出

时间:2019-07-07 13:15:50

标签: xgboost

我是XGBoost的新手。因此,如果我的问题不值得尝试,请原谅。我试图了解XGBoostRegressor背后的工作逻辑和数学。

我有三个问题:

  1. 如何选择最佳功能和分割? (我知道Greedy方法,但我想了解加权分位数方法,以获取海量数据时的效率)

  2. 在XGBoostRegressor中构造的决策树的叶节点中存在哪些值?

  3. 如何计算最终预测值? 是(目标列的平均值)+(树0的值)+(树1的值)+ .....等,还是其他?

我已经为回归问题训练了模型,但不幸的是,我无法弄清楚预测值与决策树中的叶节点值之间的关系。我已经打印了一个决策树,但是我不会得出结论。

我尝试阅读https://arxiv.org/abs/1603.02754上的研究论文,但是对于像我这样的初学者来说,理解起来太复杂了。

请帮助我!

0 个答案:

没有答案