我有一个尺寸为100×10 ^ 7的data.table。
当我这样做时
trainIndex <-
caret::createDataPartition(
df$status,
p = .9,
list = FALSE,
times = 1
)
outerTrain <- df[trainIndex]
outerTest <- df[-trainIndex]
对df行进行子设置需要20多分钟。
有效分配这个的最佳方法是什么?
这似乎是重复的,但我找不到任何解决方案。