将变量名称的向量传递给dplyr中的arrange()

时间:2014-10-21 22:54:44

标签: r sorting parameter-passing dplyr

我想传递arrange() {dplyr}一个变量名的向量来进行排序。通常我只需输入我想要的变量,但我正在尝试创建一个函数,其中排序变量可以作为函数参数输入。

df <- structure(list(var1 = c(1L, 2L, 2L, 3L, 1L, 1L, 3L, 2L, 4L, 4L
  ), var2 = structure(c(10L, 1L, 8L, 3L, 5L, 4L, 7L, 9L, 2L, 6L
  ), .Label = c("b", "c", "f", "h", "i", "o", "s", "t", "w", "x"
  ), class = "factor"), var3 = c(7L, 5L, 5L, 8L, 5L, 8L, 6L, 7L, 
  5L, 8L), var4 = structure(c(8L, 5L, 1L, 4L, 7L, 4L, 3L, 6L, 9L, 
  2L), .Label = c("b", "c", "d", "e", "f", "h", "i", "w", "y"), 
  class = "factor")), .Names = c("var1", "var2", "var3", "var4"), 
  row.names = c(NA, -10L), class = "data.frame")

# this is the normal way to arrange df with dplyr
df %>% arrange(var3, var4)

# but none of these (below) work for passing a vector of variables
vector_of_vars <- c("var3", "var4")
df %>% arrange(vector_of_vars)
df %>% arrange(get(vector_of_vars))
df %>% arrange(eval(parse(text = paste(vector_of_vars, collapse = ", "))))

5 个答案:

答案 0 :(得分:29)

哈德利并没有在帮助文件中明白这一点 - 只是在他的NSE小插图中。下划线后面的函数版本使用标准评估,因此您可以传递它们的字符串向量等。

如果我正确理解您的问题,您只需将arrange()替换为arrange_()即可。

具体来说,当你这样做时,将字符串向量作为.dots参数传递。

> df %>% arrange_(.dots=c("var1","var3"))
   var1 var2 var3 var4
1     1    i    5    i
2     1    x    7    w
3     1    h    8    e
4     2    b    5    f
5     2    t    5    b
6     2    w    7    h
7     3    s    6    d
8     3    f    8    e
9     4    c    5    y
10    4    o    8    c

========== 2018年3月更新==============

如我在此处所示,使用dplyr中的标准评估版现在被视为已弃用。您可以通过新方式阅读Hadley's programming vignette。基本上,您将使用!!取消引用一个变量,或!!!取消引用arrange()内的变量向量。

当您传递这些列时,如果它们是裸的,请使用quo()为一个变量引用它们,或者为quos()引用它们。不要使用引号。请参阅Akrun的答案。

如果您的列已经是字符串,则使用rlang::sym()为单个列创建名称,或为rlang::syms()创建名称。请参阅Christos的答案。您还可以将as.name()用于单个列。不幸的是,在撰写本文时,有关如何使用rlang::sym()的信息尚未进入上面链接的小插图(最终将根据他的草案将其放在“可变参数quasiquotation”一节中)。

答案 1 :(得分:14)

在新版本(即将发布0.6.0 dplyr)中,我们可以使用quosures

library(dplyr)
vector_of_vars <- quos(var1, var3)
df %>%
    arrange(!!! vector_of_vars)
#   var1 var2 var3 var4
#1     1    i    5    i
#2     1    x    7    w
#3     1    h    8    e
#4     2    b    5    f
#5     2    t    5    b
#6     2    w    7    h
#7     3    s    6    d
#8     3    f    8    e
#9     4    c    5    y
#10    4    o    8    c

当有多个变量时,我们使用quos,而对于单个变量,它是quoquos将返回list个引用变量,在arrange内,我们使用list取消引用!!!进行评估

答案 2 :(得分:9)

在准备精神中:

df %>% arrange(!!! rlang::syms(c("var1", "var3")))

对于单个变量,它看起来像:

df %>% arrange(!! rlang::sym(c("var1")))

答案 3 :(得分:3)

试试这个:

df %>% do(do.call(arrange_, . %>% list(.dots = vector_of_vars)))

实际上这可以简单地写成:

df %>% arrange_(.dots = vector_of_vars)

虽然在这一点上我认为它与farnsy的隐含解决方案相同。

答案 4 :(得分:1)

我认为现在您可以使用dplyr::arrange_at()

library(dplyr)

### original
head(iris)
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1          5.1         3.5          1.4         0.2  setosa
# 2          4.9         3.0          1.4         0.2  setosa
# 3          4.7         3.2          1.3         0.2  setosa
# 4          4.6         3.1          1.5         0.2  setosa
# 5          5.0         3.6          1.4         0.2  setosa
# 6          5.4         3.9          1.7         0.4  setosa

### arranged
iris %>% 
  arrange_at(c("Sepal.Length", "Sepal.Width")) %>% 
  head()
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1          4.3         3.0          1.1         0.1  setosa
# 2          4.4         2.9          1.4         0.2  setosa
# 3          4.4         3.0          1.3         0.2  setosa
# 4          4.4         3.2          1.3         0.2  setosa
# 5          4.5         2.3          1.3         0.3  setosa
# 6          4.6         3.1          1.5         0.2  setosa