XGBoost的数字和分类特征之间的特征重要性

时间:2018-09-23 18:22:21

标签: xgboost

假设我们对功能重要性类型使用默认的“权重”。似乎plot_importance函数偏向于分类特征。我的理解是XGBoost要求分类功能必须经过一键编码。因此,每个分类特征都转换为N个子分类特征,其中N是该分类特征可能产生的结果的数量。

然后,每个子类别特征将与其余子类别特征和所有数字特征竞争。数值功能获得更高的重要性排名很容易,不是吗?

0 个答案:

没有答案