我有一个大型数据框(300万+行,14列),显示一年中每天每小时的温度为346个独特的纬度和经度
JULDAY, D0cm, D2.5cm, ....
1 .84 .76
1 .83 .78
2 .20 .23
2 .19 .19
...
365 .026 .076
365 .025 .053
JULDAY是365天分为24小时(例如每行1小时,每天24行)和根据深度的相应温度值
我认为这里应该有一个简单的解决方案,但似乎无法弄明白。
基本上我想在D0cm
和D2.5
等中每天总计24个值,以获取7月份所有365个唯一值
这应该给我365个值,即每天24小时值的总和
是否是创建for循环的情况? 我相信那里有人可以指出我正确的方向
对不起,如果我没有好好解释自己,但我很累......
答案 0 :(得分:2)
我们可以使用dplyr
library(dplyr)
df1 %>%
group_by(JULDAY) %>%
summarise_each(funs(sum = sum(., na.rm=TRUE)))
或data.table
library(data.table)
setDT(df1)[, lapply(.SD, sum, na.rm=TRUE), by = JULDAY]