插入包:列车功能中的分层交叉验证

时间:2016-03-10 04:15:08

标签: r-caret cross-validation

使用列车功能将模型拟合到大的不平衡数据集时,有没有办法执行分层交叉验证?我知道可以直接进行k折交叉验证,但我的类别非常不平衡。我已经看过关于这个主题的讨论,但没有真正明确的答案。

提前致谢。

1 个答案:

答案 0 :(得分:10)

有一个名为'index'的参数,可以让用户指定索引进行交叉验证。

folds <- 4
cvIndex <- createFolds(factor(training$Y), folds, returnTrain = T)
tc <- trainControl(index = cvIndex,
               method = 'cv', 
               number = folds)

rfFit <- train(Y ~ ., data = training, 
            method = "rf", 
            trControl = tc,
            maximize = TRUE,
            verbose = FALSE, ntree = 1000)