我有一个包含四个字段的数据框DF:id, date, feature, value
。我想生成一个包含三个字段的数据框DF2:id, feature, value
,其中value
是对应id
的值,feature
表示最新可用date
}。用普利尔的说法:
DF2 <- ddply(DF, .(id, feature), function(x) c(value(x$value[x$date == max(x$date)]))
我对使用group_by和汇总的dplyr如何实现这一点感到有点不知所措。
答案 0 :(得分:1)
这只是dplyr中plyr调用的直接翻译:
library(dplyr)
DF2 = summarise(group_by(DF, id, feature), value=value[which(date == max(date))])