标签: r sqlite simulation dplyr
我在HP-Cluster上使用R运行模拟。输出通过saveRDS()功能保存。文件一旦被提取,就太大了,无法在R中直接处理。如果我能够在R外部进行一个“预处理步骤”,这将大大减小数据集的大小。步骤只是取一个值的平均值相对于因子(dplyr中的group_by()和summarise())。我遇到了this页面。不幸的是,它只描述了如何将已经加载的数据帧复制到sqlite。有没有一种简单的方法可以将外部文件(RDS)复制到sqlite而无需先在R中读取它?因为那是我想要避免的。
saveRDS()
group_by()
summarise()