如何为内存过大的RData文件进行子集化?

时间:2014-06-10 19:29:27

标签: r memory bigdata

我有一个RData文件太大而无法使用load()命令加载到我的计算机上。它包含一个包含大约300万个观测值和~100个变量的数据框。

我想

  • 加载文件,也许使用一些bigdata或ff包(但我不知道这些是如何工作的)
  • 删除一些变量以减小文件大小
  • 将其保存为带有常规数据框的Rdata文件(不是一些奇怪的“bigdata”类型对象)
  • 使用load()加载精简文件并恢复常规R操作

我应该怎么做?

1 个答案:

答案 0 :(得分:0)

上周,Jared Lander(“为所有人提供的R”一书的作者)帮助创建了一个关于bigboards.io hex的R色调。我们在其上安装了RStudio Server,我们使用了十六进制的整个存储/处理功能。 Ceph用于在节点上分发数据

无论如何,感觉就像是你问题的解决方案。