我正在搜索随机森林和 XGB“回归器”如何计算特征重要性。 然而,大部分讨论都集中在分类器上。
我试图在官方文档中找到答案,但遇到了一些问题。
在XGB official site中,get_score的描述表明 '对于线性模型,只定义了“权重”,它是 没有偏差的归一化系数。剂量意味着特征 重要性仅由输入和之间的系数计算 输出?不是由 mse 或 gini 计算的?
在RF official site中,feature_importances_的描述 表示“基于杂质的特征重要性。”但在 RF source code 第 1125 行,它指出“支持的标准是 “mse”表示均方误差,等于方差 减少作为特征选择标准'剂量RF回归器应用 用于特征重要性计算的基于杂质或 mse?
我认为基尼杂质是分类标准,所以上面的插图让我很困惑。
如果有时间能给我一个如何理解这些文件的指南会很有帮助。 例如,如何追踪我运行了哪个函数。
谢谢!