如何使用dplyr和sqlite预处理数据集

时间:2014-04-23 16:38:44

标签: r sqlite simulation dplyr

我在HP-Cluster上使用R运行模拟。
输出通过saveRDS()功能保存。文件一旦被提取,就太大了,无法在R中直接处理。
如果我能够在R外部进行一个“预处理步骤”,这将大大减小数据集的大小。
步骤只是取一个值的平均值相对于因子(dplyr中的group_by()summarise())。我遇到了this页面。不幸的是,它只描述了如何将已经加载的数据帧复制到sqlite。有没有一种简单的方法可以将外部文件(RDS)复制到sqlite而无需先在R中读取它?因为那是我想要避免的。

0 个答案:

没有答案