所以我想为我的随机森林模型执行特征选择。首先,我使用mlr然后使用randomForest软件包检查所有内容,并且功能重要性的结果有所不同。
#MLR
#DEFINE A TASK
HP48_task <- makeClassifTask(data=df_24cech_zap_omit, target='HP48')
#Feature filtering
fv = generateFilterValuesData(HP48_task, method=c('randomForest_importance'))
fv$data
#randomForest
model_first <- randomForest(HP48~., data=df_24cech_zap_omit ,importance = T)
importance(model_first, class='HP48')
> head(fv$data)
name type randomForest_importance
1 PLEC_ALL factor 6.284084
2 wiek2015 numeric 6.779634
3 wiek6_2015 factor 5.042052
4 L_OSOB_2015 numeric 3.113163
5 KLASA_MIEJSCOWOSCI factor 6.987793
6 HC11 factor 5.506360
> head(importance(model_first, class='HP48'))
NIE TAK MeanDecreaseAccuracy MeanDecreaseGini
PLEC_ALL 6.118796 -0.6763398 5.403122 14.81937
wiek2015 10.191208 0.4670294 9.553786 80.99328
wiek6_2015 5.367055 0.1594754 5.090515 37.88534
L_OSOB_2015 4.916890 -1.1206233 3.913224 51.55660
KLASA_MIEJSCOWOSCI 10.066962 -1.4121966 9.147862 59.66335
HC11 5.929320 1.5730634 6.191208 24.77438
这是正常现象还是我在代码中犯了一些错误?我应该信任哪种重要性衡量指标?