我想要做的是使用最快的方法来存储data.table
以进行进一步处理。
有些事情:
data.table
。data.table
,是吗?还有其他二元选项吗?)data.table
一遍又一遍地读取,进行切片,分组,绘图,...... 第3步的最佳选择是什么?
答案 0 :(得分:2)
好的,这里有一些关于我使用的特定数据集的测量结果。它最初是在RDS中,读取它需要60多秒。
之后,DT被保存为内部XDR以及SQLite数据库,两者都是未压缩的。
save()/ load()对速度最快,加载时间为11.7-11.8秒
SQLite(dbReadTable)非常接近,12.0-12.1秒。使用DB的文件大小减小了约30%,因此我可以想象SQLite比save()/ load()更快的情况。
现在save()/ load()适用于我,它也保留了类