使用dplyr按所有列排列数据框

时间:2018-01-08 15:45:59

标签: r dplyr tidyverse tidyselect

我正在生成1s和0s的数据帧,如下所示:

library(tidyverse)
library(glue)

num_var <- 3

rep(list(c(0L, 1L)), num_var) %>%
  set_names(glue("var_{seq_len(num_var)}")) %>%
  expand.grid() %>%
  mutate(total = rowSums(.)) %>%
  select(total, everything()) %>%
  arrange(total, desc(var_1, var_2, var_3))

#>   total var_1 var_2 var_3
#> 1     0     0     0     0
#> 2     1     1     0     0
#> 3     1     0     1     0
#> 4     1     0     0     1
#> 5     2     1     1     0
#> 6     2     1     0     1
#> 7     2     0     1     1
#> 8     3     1     1     1

reprex package(v0.1.1.9000)于2018-01-08创建。

我需要按升序排列变量的总和,然后按降序排列每个变量。使用dplyr::arrange()这非常简单。但是,我想有一个更强大的安排方法。例如,如果num_var更改为,则最后一行也必须更改为arrange(total, desc(var_1, var_2, var_3, var_4))。我尝试使用整齐的选择器everything()来安排select()函数,但是这个错误:

library(tidyverse)
library(glue)

num_var <- 3

rep(list(c(0L, 1L)), num_var) %>%
  set_names(glue("var_{seq_len(num_var)}")) %>%
  expand.grid() %>%
  mutate(total = rowSums(.)) %>%
  select(total, everything()) %>%
  arrange(total, desc(everything()))

#> Error in arrange_impl(.data, dots): Evaluation error: No tidyselect variables were registered.

reprex package(v0.1.1.9000)于2018-01-08创建。

有没有办法选择变量进行排列而不直接命名它们?

2 个答案:

答案 0 :(得分:1)

arrange似乎无法直接使用精选辅助函数。您可以按升序使用arrange_attotal,使用降序排列total以外的其他变量(使用-one_of("total")选择):

arrange_at(vars(total, desc(-one_of("total"))))

#  total var_1 var_2 var_3
#1     0     0     0     0
#2     1     1     0     0
#3     1     0     1     0
#4     1     0     0     1
#5     2     1     1     0
#6     2     1     0     1
#7     2     0     1     1
#8     3     1     1     1

答案 1 :(得分:0)

可以使用此代码从左到右排列每一列

library(magrittr) ; library(rlang) ; library(dplyr)
data %>% arrange(!!!syms(colnames(.)))

这是有效的,因为排列不接受 tidyselect 语法,因此必须为每个名称传递符号(或者也可能是字符串)