在大型数据集上按组聚合列的有效方法

时间:2018-05-23 07:02:38

标签: r dplyr aggregate

我使用聚合函数在一个组变量上聚合15列。该数据集有大约7500万条记录。此聚合函数无法说明内存问题。

在大型数据集中汇总多个列的最有效方法是什么?

第一行用于聚合:

Features<-aggregate(data=model_data, .~srl_nbr, function(x) sum(x))

0 个答案:

没有答案