对一个变量求和,取决于另一个(字符串)变量

时间:2019-08-29 18:41:08

标签: r

我希望对此有一个简单的解决方案,但我只是傻了。如果每个人的职业等于某个字符串值,我想计算每个人的年龄总计。

以下摘录了他们的数据:

  Occupation Education Age Died
1  household Secondary  39   no
2    farming   primary  83  yes
3    farming   primary  60  yes
4    farming   primary  73  yes
5    farming Secondary  51   no
6    farming iliterate  62  yes

最终,我想找到每个职业类别的平均年龄,但是努力地找到每个职业的年龄总和。

职业

有10种独特的类别
business/service 
farming                
household       
others/worker    
others/unknown   
professional             
retiree          
student               
unemployed

1 个答案:

答案 0 :(得分:0)

您可以使用group_by()中的summarizedplyr函数来做到这一点:

data %>% 
    group_by(Occupation) %>%
    summarize(total_age = sum(Age))

您还可以直接获得平均年龄:

data %>% 
    group_by(Occupation) %>%
    summarize(avg_age = mean(Age))