我有一个data.table,如下所示:
tbl
lon lat hour ens date value
1: 254 31 12 0 1994010100 0
2: 254 31 12 0 1994010200 0
3: 254 31 12 0 1994010300 0
4: 254 31 12 0 1994010400 0
5: 254 31 12 0 1994010500 0
---
40494956: 269 39 24 10 2007122700 200
40494957: 269 39 24 10 2007122800 130
40494958: 269 39 24 10 2007122900 240
40494959: 269 39 24 10 2007123000 230
40494960: 269 39 24 10 2007123100 150
和另一个看起来像:
locs
lon lat
1: 260 33
2: 261 33
3: 262 33
4: 263 33
5: 260 34
6: 261 34
我目前正在使用dcast进行此操作以使其符合我需要的形状:
temp <- dcast(tbl[locs], date ~ lon + lat + hour, fun.aggregate=mean, value.var="value")
这完全符合我的要求(即使是列名!)但速度很慢。我想要一个data.table的方式,但在阅读了几个线程后,我仍然无法完成它。我最近的尝试是这样的:
temp <- tbl[locs, list(mean = mean(value), sd = sd(value)), by = list(date, lon, lat, hour)]
折叠ens
变量(工作正常并注意我也在计算sd),但我不能重塑它。我的重塑尝试是:
temp[, as.list(setattr(list(mean,sd), 'names', list(lon, lat, hour))), by=list(date)]
Error in setattr(list(mean, sd), "names", list(lon, lat, hour)) :
'names' attribute [3] must be the same length as the vector [2]
当然,非常感谢任何帮助。谢谢。