我希望对此有一个简单的解决方案,但我只是傻了。如果每个人的职业等于某个字符串值,我想计算每个人的年龄总计。
以下摘录了他们的数据:
Occupation Education Age Died
1 household Secondary 39 no
2 farming primary 83 yes
3 farming primary 60 yes
4 farming primary 73 yes
5 farming Secondary 51 no
6 farming iliterate 62 yes
最终,我想找到每个职业类别的平均年龄,但是努力地找到每个职业的年龄总和。
职业
有10种独特的类别business/service
farming
household
others/worker
others/unknown
professional
retiree
student
unemployed
答案 0 :(得分:0)
您可以使用group_by()
中的summarize
和dplyr
函数来做到这一点:
data %>%
group_by(Occupation) %>%
summarize(total_age = sum(Age))
您还可以直接获得平均年龄:
data %>%
group_by(Occupation) %>%
summarize(avg_age = mean(Age))