Question

所以我想为我的随机森林模型执行特征选择。首先，我使用mlr然后使用randomForest软件包检查所有内容，并且功能重要性的结果有所不同。

#MLR
#DEFINE A TASK
HP48_task <- makeClassifTask(data=df_24cech_zap_omit, target='HP48')

#Feature filtering
fv = generateFilterValuesData(HP48_task, method=c('randomForest_importance'))
fv$data

#randomForest
model_first <- randomForest(HP48~., data=df_24cech_zap_omit ,importance = T)
importance(model_first, class='HP48')

> head(fv$data)
                name    type randomForest_importance 
1           PLEC_ALL  factor                6.284084
2           wiek2015 numeric                6.779634
3         wiek6_2015  factor                5.042052
4        L_OSOB_2015 numeric                3.113163 
5 KLASA_MIEJSCOWOSCI  factor                6.987793
6               HC11  factor                5.506360

> head(importance(model_first, class='HP48'))
                         NIE        TAK MeanDecreaseAccuracy MeanDecreaseGini
PLEC_ALL            6.118796 -0.6763398             5.403122         14.81937
wiek2015           10.191208  0.4670294             9.553786         80.99328
wiek6_2015          5.367055  0.1594754             5.090515         37.88534
L_OSOB_2015         4.916890 -1.1206233             3.913224         51.55660
KLASA_MIEJSCOWOSCI 10.066962 -1.4121966             9.147862         59.66335
HC11                5.929320  1.5730634             6.191208         24.77438

这是正常现象还是我在代码中犯了一些错误？我应该信任哪种重要性衡量指标？

使用mlr和randomForest软件包对功能重要性的不同结果

0 个答案: