如何为大型数据帧R语言创建性能逻辑矢量?

时间:2018-12-16 18:33:55

标签: performance testing vector split vectorization

我需要以下方面的帮助: csv文件:7.5 GB,1.85亿行。

到目前为止,我已经完成了以下操作:

library(caTools)
library(data.table)
library(dplyr)

dados_treino <- fread('train.csv')

vetor_TF  <- sample.split(dados_treino, SplitRatio = 0.70)

此时,R Studio返回错误:

  

无法分配7.5 GB的矢量大小

目的是将对象分为训练和测试数据。

我寻求帮助: 1)能够使用命令样本(可能与CATOOLS的软件包不同); 2)应用在两组数据中构造的向量

跟随数据链接:download data

我正在使用具有16 GB RAM和Intel i7处理器的计算机

0 个答案:

没有答案