对于具有10 ^ 7列的数据集,在R中对行进行子集的有效方法

时间:2018-04-14 00:00:17

标签: r data.table

我有一个尺寸为100×10 ^ 7的data.table。

当我这样做时

    trainIndex <-
      caret::createDataPartition(
        df$status,
        p = .9,
        list = FALSE,
        times = 1
      )
    outerTrain <- df[trainIndex]
    outerTest  <- df[-trainIndex]

对df行进行子设置需要20多分钟。

有效分配这个的最佳方法是什么?

这似乎是重复的,但我找不到任何解决方案。

0 个答案:

没有答案