The image shows part my data set.HD comprises the presence or absence of heart disease.
我想将年龄划分为
范围25<Age<=35,35<Age<=45,45<Age<=55,55<Age<=65,65<Age<=75,75<Age<=85
然后计算该年龄范围内患有心脏病的人数。如何为此编写R代码?
答案 0 :(得分:0)
library(dplyr)
您可以使用dplyr中的group_by和count函数按切割函数和计数划分为范围:
df$group <- cut(df$Age, breaks = seq(25,85,by=10), right = TRUE)
df %>%
group_by(group) %>%
tally(HD == "present")
如果您想查看每个年龄组中有多少人患有该疾病,有多少人没有,请在上面的代码中将tally(HD == "present")
替换为count(HD)
。