随机森林中每个特征级别的重要性顺序

时间:2021-02-20 05:59:56

标签: python scikit-learn random-forest

使用 SciKitLearn 的随机森林分类器拟合模型后,我得到了特征重要性列表,但我能否得到特征级别的重要性。

例如,如果我得到以下关于特征重要性的系列,我怎么知道哪一天_of_week最重要?

online_users            0.107735
number_of_post          0.051478
day_of_week             0.042552
total_votes             0.131286
polarity                0.033352

1 个答案:

答案 0 :(得分:2)

我认为您可以为 day_of_week 创建一个虚拟变量,然后在合并虚拟变量并删除 day_of_week 后在新特征集上运行特征重要性。

pd.get_dummies(df['day_of_week'])
相关问题