按组计算因子的出现次数

时间:2018-06-02 23:00:37

标签: r dplyr

我正在处理一些dplyr问题。我想创建一个新的变量,它是因子级别的频率,但我想按组进行。这是我的数据摘录:

">>"    { return '>>' }
">"     { return '>' }

我想得到这样的结果:

>

我尝试了以下代码,并修改了它,但我总是得到同样的错误:

head(Dataset)
Code_PR   Code_SP  Status_SP
  PR1        SP1       0
  PR1        SP2       0
  PR1        SP3       1
  PR2        SP1       0
  PR2        SP2       1

我该如何解决?

非常感谢

2 个答案:

答案 0 :(得分:2)

df %>% 
  group_by(Code_PR) %>% 
  summarise(Count = n()
            , Ratio = mean(Status_SP))

## A tibble: 2 x 3
#   Code_PR Count Ratio
#   <chr>   <int> <dbl>
# 1 PR1         3 0.333
# 2 PR2         2 0.500

答案 1 :(得分:1)

Dataset %>% 
  group_by(Code_PR) %>% 
  summarise(Count = n(), Ratio = paste0(sum(Status_SP),"/",n()))