使用 SciKitLearn 的随机森林分类器拟合模型后,我得到了特征重要性列表,但我能否得到特征级别的重要性。
例如,如果我得到以下关于特征重要性的系列,我怎么知道哪一天_of_week最重要?
online_users 0.107735
number_of_post 0.051478
day_of_week 0.042552
total_votes 0.131286
polarity 0.033352
答案 0 :(得分:2)
我认为您可以为 day_of_week 创建一个虚拟变量,然后在合并虚拟变量并删除 day_of_week 后在新特征集上运行特征重要性。
pd.get_dummies(df['day_of_week'])