如何在randomForest中获取finalModel选中的功能?

时间:2017-01-27 11:44:08

标签: r random-forest decision-tree r-caret

我正在使用插入符号来训练parRF模型,其中包含一个包含mtry = 3:20序列的tunegrid。

算法完成后,将打印以下内容:

 mtry  ROC        Sens       Spec     
   2    0.7420331  0.6204671  0.7424294
   3    0.7476080  0.6390894  0.7343044
   4    0.7472579  0.6364214  0.7376243
   5    0.7476245  0.6351781  0.7349261
   6    0.7476901  0.6340793  0.7424026
   7    0.7485309  0.6323017  0.7431485
   8    0.7477496  0.6330511  0.7459274
   9    0.7481676  0.6301848  0.7462164
  10    0.7472944  0.6298118  0.7496909
  11    0.7474194  0.6325235  0.7514651
  12    0.7470044  0.6303864  0.7512466
  13    0.7471885  0.6261626  0.7511862
  14    0.7460856  0.6264819  0.7522480
  15    0.7467873  0.6261324  0.7561996
  16    0.7479428  0.6255679  0.7550840
  17    0.7464456  0.6260585  0.7537030
  18    0.7466500  0.6236055  0.7542641
  19    0.7473104  0.6262634  0.7562870
  20    0.7473408  0.6232997  0.7595128

最好的ROC使用mtry = 7.我想提取这七个特征,是否可能?

1 个答案:

答案 0 :(得分:0)

我的印象是mtry确定了树中每个节点/分割处采样的特征数量。这并不意味着使用了7个功能。

您希望在使用mtry = 7时查看模型的功能重要性。

可能有用:https://topepo.github.io/caret/variable-importance.html

文档中有一些示例解释了如何提取功能重要性以及指标的含义。

在对您提取的功能做出任何强有力的假设之前,请确保您的模型设置正确。