如何在R中的randomForest 回归中实施分层抽样?我知道strata和sampsize参数用于randomForest分类问题,但我得到了 {:任务1失败 - “sampsize应该是长度为1的错误。”
我的数据:
x <- sample(1:10, 100, replace = TRUE)
y <- sample(1:20, 100, replace = TRUE)
Region <- sample(c('N', 'S'), 100, replace = TRUE)
df <- data.frame(x, y, Region)
我的代码:
randomForest(x ~ y, data = df, sampsize = c(30,20), strata = df$Region)
我的实际分析在群体之间的不平衡程度远远超过这个。谢谢。