在行不是数字时对行进行排序

时间:2017-07-16 01:26:31

标签: r sorting dplyr tidyr

使用下面的df,根据group/year的每个组合,我为每个单元创建了一个频率表。

获得绝对和相对频率后,我将这些值粘贴到一列Frequency

我是否有办法在更改表格以使行上有单位后,根据2016年n群组的Total按降序排列?我希望我的最终输出没有nprop的行,只有Frequency

df <- data.frame(cbind(sample(c('Controle','Tratado'),
                              10, replace = T),
                       sample(c(2012,2016), 10, T),
                       c('A','B','A','B','C','D','D','A','F','A')))

colnames(df) <- c('Group', 'Year', 'Unit')

table <- df %>%
  group_by(Year, Group) %>%
  count(Unit) %>%
  mutate(prop = prop.table(n)) %>%
  bind_rows(df %>%                                               
              mutate(Group ="Total") %>%                         
              group_by(Year, Group) %>%                         
              count(Unit)) %>%
  mutate(prop = prop.table(n))

is.num <- sapply(table, is.numeric)
table[is.num] <- lapply(table[is.num], round, 4)
table <- table %>%
  mutate(Frequency = paste0(n,' (', 100*prop,'%)'))

table <- table %>%
  gather(type, measurement, -Year, -Group, -Unit) %>%
  unite(year_group, Year:Group, sep = ":") %>%
  spread(year_group, measurement) 

以下是我期望产生的内容:

 Unit      type 2012:Total 2012:Tratado 2016:Controle 2016:Total 2016:Tratado
1    A Frequency 2 (66.67%)   2 (66.67%)             - 2 (28.57%)     2 (100%)
2    D Frequency          -            -       2 (40%) 2 (28.57%)            -
3    B Frequency 1 (33.33%)   1 (33.33%)       1 (20%)  1 (14.29%)           -
4    C Frequency          -            -       1 (20%)  1 (14.29%)           -
5    F Frequency          -            -       1 (20%)  1 (14.29%)            -

请注意,结果是根据列2016:Total

排序的

1 个答案:

答案 0 :(得分:0)

我自己找到了一种方式,可能不是最好的方式。

在运行问题代码后,我做了以下事情:

table <- subset.data.frame(table, type == 'Frequency')

table <- table %>% 
  mutate(value = substr(Total_2016, 1, nchar(Total_2016) - 7 )) %>%
  mutate(value = as.numeric(value)) %>%
  arrange(desc(value))