标签: r dplyr aggregate
我使用聚合函数在一个组变量上聚合15列。该数据集有大约7500万条记录。此聚合函数无法说明内存问题。
在大型数据集中汇总多个列的最有效方法是什么?
第一行用于聚合:
Features<-aggregate(data=model_data, .~srl_nbr, function(x) sum(x))