我需要以下方面的帮助: csv文件:7.5 GB,1.85亿行。
到目前为止,我已经完成了以下操作:
library(caTools)
library(data.table)
library(dplyr)
dados_treino <- fread('train.csv')
vetor_TF <- sample.split(dados_treino, SplitRatio = 0.70)
此时,R Studio返回错误:
无法分配7.5 GB的矢量大小
目的是将对象分为训练和测试数据。
我寻求帮助: 1)能够使用命令样本(可能与CATOOLS的软件包不同); 2)应用在两组数据中构造的向量
跟随数据链接:download data
我正在使用具有16 GB RAM和Intel i7处理器的计算机