我有一个员工数据集,格式如下(T表示"终止",A表示"活动"):
ID Name StayYears Status Country
1 John 3.5 T USA
2 Mary 2.1 A USA
3 Ben 1.7 T French
4 Kevin 3.2 T India
5 Cindy 2.6 A French
6 Jack 3.9 A USA
7 Peter 1.3 A India
8 Andy 2.7 T French
9 David 0.8 A India
10 Nick 1.1 A USA
我应该使用哪种统计R方法来了解哪个时期(例如1.5~2.0岁)和国家/地区的终止率最高?
我是R和Statistic的新手,希望有人能给我指导,非常感谢!!
答案 0 :(得分:1)
也许这有帮助
library(dplyr)
df1 %>%
group_by(yearGrp = cut(StayYears, breaks = seq(0, max(StayYears)+0.5, 0.5)), Country) %>%
summarise(n = mean(Status=="T")) %>%
ungroup() %>%
filter(n == max(n))