在`dplyr`数据管道函数中将排序方向传递给`arrange`

时间:2018-06-17 20:31:34

标签: r dplyr dbplyr

我有一个用我的数据做很多事情的函数。但是我想添加一个排序顺序参数,当参数传递给函数时,允许我在相反的方向上一步翻转数据。我需要该函数与dbplyr的SQL后端兼容。

我目前的解决方案似乎非常不优雅。我有两个完整的数据管道,一个有desc()而另一个没有。这感觉非常笨重,但是因为我必须在desc()中围绕我的领域包裹dplyr,所以我想不出怎么做。一个想法可能是创建一个1-1的排序参数,并在排序之前乘以我的字段。有更简单或更简单的方法吗?

这是一个简单的玩具示例,展示了我如何创建两个管道:

library(dplyr)

df <- data.frame(x = rnorm(10))

stupid_func <- function(df, sort_order = 'asc'){
  ## does many things in reality, this is a toy example

  if (sort_order == 'asc') {
    df %>% arrange(x) %>% return
  } else if (sort_order == 'desc') {
    df %>% arrange(desc(x)) %>% return
  }

}

stupid_func(df, 'desc')
#>             x
#> 1   1.6680607
#> 2   1.4853252
#> 3   1.1468913
#> 4   1.0447893
#> 5   0.5243115
#> 6   0.3784285
#> 7  -0.5693750
#> 8  -0.8744429
#> 9  -1.0346144
#> 10 -2.6256735

stupid_func(df)
#>             x
#> 1  -2.6256735
#> 2  -1.0346144
#> 3  -0.8744429
#> 4  -0.5693750
#> 5   0.3784285
#> 6   0.5243115
#> 7   1.0447893
#> 8   1.1468913
#> 9   1.4853252
#> 10  1.6680607

这里使用的排序参数映射到fac1

-1
stupid_func2 <- function(df, sort_order = 'asc'){
  ## does many things in reality

  if (sort_order == 'asc') {
    fac <- 1
  } else {
    fac <- -1
  }

  df %>% arrange(fac * x) %>% return

}

2 个答案:

答案 0 :(得分:6)

为了完全避免控制流,您可以将descidentity作为函数而不是字符串传递并调用它:

library(dplyr)
set.seed(47)

df <- data.frame(x = rnorm(2))

f <- function(data, sort_fun = identity){
    arrange(data, sort_fun(x))
}

f(df)
#>           x
#> 1 0.7111425
#> 2 1.9946963

f(df, desc)
#>           x
#> 1 1.9946963
#> 2 0.7111425

如果你真的想输入字符串,可以使用它们来查找相应的函数,这可以用同样的方式调用:

f2 <- function(data, sort_order = c('asc', 'desc')){
    sort_order <- match.arg(sort_order)
    sort_fun <- list(asc = identity, desc = desc)[[sort_order]]
    arrange(data, sort_fun(x))
}

f2(df)
#>           x
#> 1 0.7111425
#> 2 1.9946963

f2(df, 'desc')
#>           x
#> 1 1.9946963
#> 2 0.7111425

您可以同样查找表达式,这样可以完全避免identity

f3 <- function(data, sort_order = c('asc', 'desc')){
    sort_order <- match.arg(sort_order)
    sort_expr <- list(asc = expr(x), desc = expr(desc(x)))[[sort_order]]
    arrange(df, !!sort_expr)
}

f3(df)
#>           x
#> 1 0.7111425
#> 2 1.9946963

f3(df, 'desc')
#>           x
#> 1 1.9946963
#> 2 0.7111425

答案 1 :(得分:2)

如何将if / else语句移动到Arrange函数中:

stupid_func <- function(df, ascending=TRUE){
    ## does many things in reality, this is a toy example

    df %>% arrange(if(ascending) x else desc(x))
}

stupid_func(df)
#               x
#1  -1.4162465950
#2  -1.0428581093
#3  -0.3558181508
#4  -0.2366332875
#5   0.0003166344
#6   0.5146631983
#7   0.6390745275
#8   0.7459405376
#9   1.6161165230
#10  1.9243922633

stupid_func(df, ascending = FALSE)
#               x
#1   1.9243922633
#2   1.6161165230
#3   0.7459405376
#4   0.6390745275
#5   0.5146631983
#6   0.0003166344
#7  -0.2366332875
#8  -0.3558181508
#9  -1.0428581093
#10 -1.4162465950