R代码将年龄划分为范围,并根据另一个分类变量获得该年龄段中的人数

时间:2017-05-01 04:41:35

标签: r

The image shows part my data set.HD comprises the presence or absence of heart disease.

我想将年龄划分为

范围
25<Age<=35,35<Age<=45,45<Age<=55,55<Age<=65,65<Age<=75,75<Age<=85 

然后计算该年龄范围内患有心脏病的人数。如何为此编写R代码?

1 个答案:

答案 0 :(得分:0)

library(dplyr)

您可以使用dplyr中的group_by和count函数按切割函数和计数划分为范围:

df$group <- cut(df$Age, breaks = seq(25,85,by=10), right = TRUE)
df %>% 
group_by(group) %>%
tally(HD == "present")

如果您想查看每个年龄组中有多少人患有该疾病,有多少人没有,请在上面的代码中将tally(HD == "present")替换为count(HD)