feature_importances_在scikit-learn中使用随机森林时

时间:2015-09-04 22:34:21

标签: scikit-learn random-forest

我在scikit-learn中使用随机森林。我使用feature_importances_来查看每个特征在预测目标中的重要程度。但我不明白这个分数是多少。谷歌搜索feature_importances_表示它是平均减少杂质。但我仍然感到困惑,这是否与平均减少gigi杂质相同。如果是这样,如何计算树木和随机森林?除了数学,我想真正理解它是什么意思。

1 个答案:

答案 0 :(得分:1)

feature_importances_函数将告诉您每个功能对预测的贡献程度(信息增益)

随机森林基于基尼,信息增益,卡方或熵对自变量或特征进行分类。这些功能将获得高分,这对信息增益贡献最大。