拟合后我得到了一个xgboost模型。 然后,我将model.apply()与一些测试数据一起使用来获取叶子索引:
测试数据0:树0(例如23)的叶子索引,树1(例如17)的索引,.....
测试数据1:树0的叶子索引(例如16),树1的索引(例如22),... ...
我还使用xgboost.plot_tree来显示树0。如果树的max_depth = 4,则有31个节点。
用决策树0手动计算测试数据0,并获得叶子位置。
似乎很难将“该叶子的位置”和“上一个叶子索引”链接起来(例如23)。
仅网站-https://xgboost.readthedocs.io/en/latest/python/python_api.html中的描述: “对于X中的每个数据点x和每棵树,返回叶子x的索引最终到达。叶子在[0; 2 **(self.max_depth + 1))内进行编号,可能在编号上存在间隙。”
如何解释xgboost树中的叶子索引?