我正在处理一些dplyr问题。我想创建一个新的变量,它是因子级别的频率,但我想按组进行。这是我的数据摘录:
">>" { return '>>' }
">" { return '>' }
我想得到这样的结果:
>
我尝试了以下代码,并修改了它,但我总是得到同样的错误:
head(Dataset)
Code_PR Code_SP Status_SP
PR1 SP1 0
PR1 SP2 0
PR1 SP3 1
PR2 SP1 0
PR2 SP2 1
我该如何解决?
非常感谢
答案 0 :(得分:2)
df %>%
group_by(Code_PR) %>%
summarise(Count = n()
, Ratio = mean(Status_SP))
## A tibble: 2 x 3
# Code_PR Count Ratio
# <chr> <int> <dbl>
# 1 PR1 3 0.333
# 2 PR2 2 0.500
答案 1 :(得分:1)
Dataset %>%
group_by(Code_PR) %>%
summarise(Count = n(), Ratio = paste0(sum(Status_SP),"/",n()))