使用列车功能将模型拟合到大的不平衡数据集时,有没有办法执行分层交叉验证?我知道可以直接进行k折交叉验证,但我的类别非常不平衡。我已经看过关于这个主题的讨论,但没有真正明确的答案。
提前致谢。
答案 0 :(得分:10)
有一个名为'index'的参数,可以让用户指定索引进行交叉验证。
folds <- 4
cvIndex <- createFolds(factor(training$Y), folds, returnTrain = T)
tc <- trainControl(index = cvIndex,
method = 'cv',
number = folds)
rfFit <- train(Y ~ ., data = training,
method = "rf",
trControl = tc,
maximize = TRUE,
verbose = FALSE, ntree = 1000)