如何在R中创建一个包含两个类别列的频率表?

时间:2018-04-26 06:04:33

标签: r dplyr tabular contingency

我正在尝试让下面的表格看起来更像下面的表格,其中第一列MIPS_Group的每个唯一值只出现一次,是否有人知道如何做到这一点?

df %>%
  count(MIPS_Group, WES_Cohort) %>% 
  arrange(desc(n)) %>%
  mutate(PercentageOfMatching = n / sum(n))

当前输出:

enter image description here

格式我正在努力实现:

enter image description here

1 个答案:

答案 0 :(得分:0)

duplicated()是可能的解决方案之一:

df %>%
  count( MIPS_Group, WES_Cohort ) %>% 
  arrange( desc( n ) ) %>%
  mutate( PercentageOfMatching = n / sum( n ) ) %>%
  group_by( MIPS_group ) %>%
  mutate( MIPS_group = ifelse( duplicated( MIPS_group ), NA, MIPS_group )