如何将35 GB数据加载到R?

时间:2015-02-20 09:44:11

标签: r data.table ff

我有一个维度为2000万条记录和50列的数据集。现在我想将此数据集加载到R.我的机器RAM大小为8 GB,我的数据集大小为35 GB。我必须在完整的数据上运行我的R代码。到目前为止,我尝试使用data.table(fread),bigmemory(read.big.matrix)包读取该数据但未成功。是否可以将35 GB数据加载到我的机器中(8 GB)?

如果可能,请指导我如何克服这个问题?

提前致谢。

1 个答案:

答案 0 :(得分:3)

购买更多内存。即使您设法加载所有数据(看起来像它的文本),也不会留在内存中的任何空间来做任何您想要对数据做的事情。

如果您必须立即将所有内容加载到RAM中,它实际上可能是唯一正确的答案。你可能不必,但即便如此,购买更多内存可能会更容易。

查看云计算选项,例如AzureAWSGoogle Compute Engine