我想使用库(插入符号)的功能选择功能,但无论如何都要努力
实现基于随机森林回归和
使用相应的变量名称标记输出图
我尝试的是:
给出样本数据:
set.seed(2014)
a<- rnorm(1000, mean = 10, sd = 3)
b<- rnorm(1000, mean = 15, sd = 2)
c<- rnorm(1000, mean = 20, sd = 2)
d<- rnorm(1000, mean = 25, sd = 2)
e<- rnorm(1000, mean = 30, sd = 2)
f<-rnorm(1000, mean = 45, sd = 2)
g<-rnorm(1000, mean = 50, sd = 2)
h<-rnorm(1000, mean = 60, sd = 2)
depvar<-rpois(1000, exp(3+ 0.5*a - 0.25*b+0.3*c))
data<-data.frame(a,b,c,d,e,f,g,h,depvar)
library(mlbench)
library(caret)
library(randomForest)
使用随机森林选择函数
定义控件 control <- rfeControl(functions=rfFuncs, method="cv", number=10)
运行RFE算法
results <- rfe(data[,1:8], data[,9], sizes=c(1:10), rfeControl=control)
这需要一段时间。但它运作正常。添加其他变量并将行数扩展到10000例如只需要永远。因此,我不确定这是否真的是随机森林回归而不是分类......有没有办法用大约20个数字变量给出类似的设置来改善运行时间?
ggplot(results)
或普通的
plot(results, type=c("g", "o"))
我也可以找到关于x轴标签的任何内容。有没有办法添加相应的变量而不是1,2,3 ...
提前谢谢