如何基于唯一标识符对行进行求和

时间:2016-04-29 03:24:06

标签: r dataframe

我有一个大型数据框(300万+行,14列),显示一年中每天每小时的温度为346个独特的纬度和经度

JULDAY, D0cm, D2.5cm, ....
1       .84   .76
1       .83   .78
2       .20   .23
2       .19   .19
...
365     .026  .076
365     .025  .053

JULDAY是365天分为24小时(例如每行1小时,每天24行)和根据深度的相应温度值

我认为这里应该有一个简单的解决方案,但似乎无法弄明白。

基本上我想在D0cmD2.5等中每天总计24个值,以获取7月份所有365个唯一值 这应该给我365个值,即每天24小时值的总和

是否是创建for循环的情况? 我相信那里有人可以指出我正确的方向

对不起,如果我没有好好解释自己,但我很累......

1 个答案:

答案 0 :(得分:2)

我们可以使用dplyr

library(dplyr)
df1 %>%
   group_by(JULDAY) %>%
   summarise_each(funs(sum = sum(., na.rm=TRUE)))

data.table

library(data.table)
setDT(df1)[, lapply(.SD, sum, na.rm=TRUE), by = JULDAY]