正确选择功能?

时间:2015-01-28 15:08:37

标签: r r-caret

我想使用库(插入符号)的功能选择功能,但无论如何都要努力

  1. 实现基于随机森林回归和

  2. 的功能
  3. 使用相应的变量名称标记输出图

  4. 我尝试的是:

    给出样本数据:

         set.seed(2014)
         a<- rnorm(1000, mean = 10, sd = 3)
         b<- rnorm(1000, mean = 15, sd = 2)
         c<- rnorm(1000, mean = 20, sd = 2)
         d<- rnorm(1000, mean = 25, sd = 2)
         e<- rnorm(1000, mean = 30, sd = 2)
         f<-rnorm(1000, mean = 45, sd = 2)
         g<-rnorm(1000, mean = 50, sd = 2)
         h<-rnorm(1000, mean = 60, sd = 2)
         depvar<-rpois(1000, exp(3+ 0.5*a - 0.25*b+0.3*c))
         data<-data.frame(a,b,c,d,e,f,g,h,depvar)
    
    library(mlbench)
    library(caret)
    library(randomForest)
    

    使用随机森林选择函数

    定义控件
         control <- rfeControl(functions=rfFuncs, method="cv", number=10)
    

    运行RFE算法

         results <- rfe(data[,1:8], data[,9], sizes=c(1:10), rfeControl=control)
    

    这需要一段时间。但它运作正常。添加其他变量并将行数扩展到10000例如只需要永远。因此,我不确定这是否真的是随机森林回归而不是分类......有没有办法用大约20个数字变量给出类似的设置来改善运行时间?

         ggplot(results)
    

    或普通的

        plot(results, type=c("g", "o"))
    

    我也可以找到关于x轴标签的任何内容。有没有办法添加相应的变量而不是1,2,3 ...

    提前谢谢

0 个答案:

没有答案