随机森林和 XGB 'Regressor' 如何计算特征重要性

时间:2021-06-27 10:24:39

标签: python scikit-learn random-forest xgboost feature-selection

我正在搜索随机森林和 XGB“回归器”如何计算特征重要性。 然而,大部分讨论都集中在分类器上。

我试图在官方文档中找到答案,但遇到了一些问题。

  1. XGB official site中,get_score的描述表明 '对于线性模型,只定义了“权重”,它是 没有偏差的归一化系数。剂量意味着特征 重要性仅由输入和之间的系数计算 输出?不是由 mse 或 gini 计算的?

  2. RF official site中,feature_importances_的描述 表示“基于杂质的特征重要性。”但在 RF source code 第 1125 行,它指出“支持的标准是 “mse”表示均方误差,等于方差 减少作为特征选择标准'剂量RF回归器应用 用于特征重要性计算的基于杂质或 mse?

我认为基尼杂质是分类标准,所以上面的插图让我很困惑。

如果有时间能给我一个如何理解这些文件的指南会很有帮助。 例如,如何追踪我运行了哪个函数。

谢谢!

0 个答案:

没有答案