如何在统计中找出具有最高终止价值的时期?

时间:2017-06-21 03:46:06

标签: r statistics

我有一个员工数据集,格式如下(T表示"终止",A表示"活动"):

ID    Name    StayYears  Status  Country
1     John    3.5        T       USA
2     Mary    2.1        A       USA
3     Ben     1.7        T       French
4     Kevin   3.2        T       India
5     Cindy   2.6        A       French
6     Jack    3.9        A       USA
7     Peter   1.3        A       India
8     Andy    2.7        T       French
9     David   0.8        A       India
10    Nick    1.1        A       USA

我应该使用哪种统计R方法来了解哪个时期(例如1.5~2.0岁)和国家/地区的终止率最高?

我是R和Statistic的新手,希望有人能给我指导,非常感谢!!

1 个答案:

答案 0 :(得分:1)

也许这有帮助

library(dplyr)
df1 %>% 
 group_by(yearGrp = cut(StayYears, breaks = seq(0, max(StayYears)+0.5, 0.5)), Country) %>% 
 summarise(n = mean(Status=="T")) %>% 
 ungroup() %>%
 filter(n == max(n))