循环训练数据的循环列值r

时间:2016-06-07 20:09:23

标签: r


我正在尝试从数据框架构建培训和测试模型。我正在使用随机森林方法并构建模型。
我的数据框有6列,第一列是结果(是/否),其余5列是独立变量。我使用所有自变量构建模型(结果〜。,data = training,method =“rf”)。 我想要做的是尝试所有可能的自变量组合并生成一个模型(如col1,col1 + col2,col1 + col2 + col3等等)。我的数据框可能有120种组合。
我需要帮助在循环中自动执行此操作,但我无法弄清楚如何将循环放在一起。 提前谢谢。

data <- read.csv("temp.csv", header = TRUE)
splitdata <- createDataPartition(y=data$var1, p=0.75)
training <- df[splitdata,]
testing  <- df[-splitdata,]
no_of_cols <- 2:ncol(training)
for (i in no_col)
{
   permn (no_of_col)
   #model <- train(var1 ~ ., data=training,  method="rf")
    model[i] <- train(var1 ~ training[,i], data=training,  method="rf")        
    predictions[i] <- predict(model[i],newdata=testing)
} 

1 个答案:

答案 0 :(得分:0)

我相信你需要的只是快速修复你的for循环:

for (i in 1:no_col)
{
  code
}