标签: xgboost
假设我们对功能重要性类型使用默认的“权重”。似乎plot_importance函数偏向于分类特征。我的理解是XGBoost要求分类功能必须经过一键编码。因此,每个分类特征都转换为N个子分类特征,其中N是该分类特征可能产生的结果的数量。
然后,每个子类别特征将与其余子类别特征和所有数字特征竞争。数值功能获得更高的重要性排名很容易,不是吗?