R中的数据集文件大小,可能是开销吗?

时间:2015-02-11 18:40:11

标签: r

我正在使用stat transfer将数据集从SAS文件格式转换为R格式。 SAS中的文件大约为489mb,转换为Rdata时为520mb。鉴于文件是4090222 x 11" cell"的数据框,我认为可以在一定程度上解释差异。

但是当我打开转换后的数据集,并要求R保存它时,530mb下降到120mb左右,我真的不明白为什么会发生这种情况。我怀疑数据被删除(因为调整大小是如此值得注意),但据我所知,这不会发生。

我尝试过all.equal,返回TRUE。事实上,我尝试的一切都告诉我,数据集确实是相同的...但是它没有加起来?

我犯了一些大错?

编辑:请参阅下面的Gregors,"问题"解决!

1 个答案:

答案 0 :(得分:4)

将我的评论转化为答案:

R将数据保存为.RData时压缩数据,与其他统计编程语言相比,它实际上做得非常出色,如this blog entry所示。

所以答案是,你不应该担心。