我的目标是通过使用日期将当前天的观察值与同一ID的所有先前观察值相加来创建另一列(数据集按date和chr nr(ID)排序。我需要汇总出现新的“ id”时重新开始。
可能有som NA,应将它们视为null
“ Doseringer_pr_kg_dyr”是观察值。
CHR_NR DATO_AFSLUT Doseringer_pr_kg_dyr brugstid
10358 2018-08-06 29416.67 31
10358 2018-09-06 104682.27 36
10358 2018-10-12 10333.33 26
10358 2018-11-07 10090.91 27
10358 2018-12-04 8000.00 NA
13168 2012-01-23 12042.25 2
13168 2012-01-25 9000.00 42
13168 2012-03-07 44450.70 19
13168 2012-03-26 35000.00 37
13168 2012-05-02 93478.26 70
我希望会出现一些问题
CHR_NR DATO_AFSLUT Doseringer_pr_kg_dyr brugstid sum
10358 2018-11-07 10090.91 27 [108,6]+[109,3]
10358 2018-12-04 8000.00 NA [109,6]+[110,3]
13168 2012-01-23 12042.25 2 [111,3]
13168 2012-01-25 9000.00 42 [111,6]+[112,3]
13168 2012-03-07 44450.70 19 [112,6]+[113,3]
其中[行,列] + [行,列]在新列中相加。
我想到了apply函数之一 或类似这样的循环:
agg <- function(dat) {
last_row <- 0
for ( row in dat ) {
if ( row[1] == last_row[1] ) {
row[6] <- last_row[6] + row[3]
} else {
row[6] <- row[3]
}
last_row <- row
}
}