我将此作为大约6000行数据集的一部分:
ÅR LM RE AGE PA REC
1 2012 PKORT Stockholm <19 17973 35508
2 2012 PKORT Stockholm 20-24 31042 63229
3 2012 PKORT Stockholm 25-29 27305 64558
4 2012 PKORT Stockholm 30-34 18256 42726
5 2012 PKORT Stockholm 35-39 13200 32145
6 2012 PKORT Stockholm 40< 9458 24422
7 2012 PKORT Stockholm 40< 6123 16152
我希望将PA和REC的所有行相加,其中AGE为“40&lt;”从大量相同的因子水平减少数据框架。 我已经尝试了聚合,tapply并且还假设R理解“40&lt;”应用lm函数时应该求和。
这似乎是一个非常简单的操作,任何帮助都表示赞赏。
答案 0 :(得分:0)
我们可以使用dplyr
library(dplyr)
df1 %>%
filter(AGE == "40<") %>%
group_by_(.dots = names(df1)[1:3]) %>%
summarise_at(vars(PA, REC) , sum)