水管工dplyr过滤器无法正常工作

时间:2019-05-13 15:45:20

标签: r dplyr plumber

我写了以下简单的plumber api

library(plumber)
library(dplyr)


#* @apiTitle TESTS API

#* Returns json with filtered mtcars
#* @param carb 
#* @param gear 
#* @get /test2
#* @serializer unboxedJSON
function(carb,gear) {
  mtcars %>% filter(gear == as.numeric(gear),
                    carb == as.numeric(carb)) %>% 
    jsonlite::toJSON()

}

A,当我称它为mtcars数据时,并没有按照我的预期进行过滤:

library(httr)
library(jsonlite)
library(dplyr)
response <- GET(url = 'http://127.0.0.1:3098/test2', 
                query = list(gear = 4,
                             carb = 4),
                encode="json")
content(response, encoding = "json") %>% fromJSON() %>% head()

   mpg cyl disp  hp drat    wt  qsec vs am gear carb
1 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
2 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
3 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
4 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
5 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
6 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1


我在做什么错了?

2 个答案:

答案 0 :(得分:2)

dplyr和朋友 1 很聪明,但是他们无法区分对gear(和carb)的两个引用。例如,在gear == as.numeric(gear)中,您希望第一个引用框架中的gear,第二个引用函数参数,但是在这些函数中,gear的第一个匹配项(在框架内,在功能环境内,在封闭环境内)获胜并将用于所有引用。在这种情况下,它们都与框架的列匹配,因此始终为TRUE(在此示例中)。

尝试:

function(carb., gear.) {
  mtcars %>% filter(gear == as.numeric(gear.),
                    carb == as.numeric(carb.)) %>% 
    jsonlite::toJSON()

}

这具有不幸的副作用,即API参数不太美观。因此,如果您想保留它们的外观(或者有外部动机来保持它们的原样),请快速重新分配。

function(carb, gear) {
  c. <- carb
  g. <- gear
  mtcars %>%
    filter(gear == as.numeric(g.),
           carb == as.numeric(c.)) %>% 
    jsonlite::toJSON()
}

旁注:我发现有时可以实现允许性过滤,其中省略(或故意为空)的参数表示不进行过滤。

function(carb = NA, gear = NA) {
  c. <- carb
  g. <- gear
  mtcars %>%
    filter(is.na(g.) | gear == as.numeric(g.),
           is.na(c.) | carb == as.numeric(c.)) %>% 
    jsonlite::toJSON()
}

另一点说明:您在此处执行双重JSON是否有原因?例如,我看到了:

$ curl -s localhost:8000/test2?gear=4
"[{\"mpg\":21,\"cyl\":6,\"disp\":160,\"hp\":110,\"drat\":3.9,\"wt\":2.62,\"qsec\":16.46,\"vs\":0,\"am\":1,\"gear\":4,\"carb\":4},...]"

这将返回一个长字符串(请注意引号)。许多解析器会将其视为字符串并将其保留。 (例如,管道curl ... | jq .并没有像应有的那样打开json,它只是返回文字字符串。)

相反,如果您删除toJSON,则会看到:

$ curl -s localhost:8000/test2?gear=4
[{"mpg":21,"cyl":6,"disp":160,"hp":110,"drat":3.9,"wt":2.62,"qsec":16.46,"vs":0,"am":1,"gear":4,"carb":4},...]

这是一个“正确的” json返回值,可以正确解析。在curl调用之后添加| jq .可以正确解析输出:

$ curl -s localhost:8000/test2?gear=4 | jq .
[
  {
    "mpg": 21,
    "cyl": 6,
    "disp": 160,
    "hp": 110,
    "drat": 3.9,
    "wt": 2.62,
    "qsec": 16.46,
    "vs": 0,
    "am": 1,
    "gear": 4,
    "carb": 4
  },
  ...
]

注意:

  1. 我应该注意,这不是dplyr所独有的,也不应为此承担任何责任。使用base::withbase::within可以看到相同的行为。比较两者:

    func <- function(carb, gear) { browser(); 1; }
    func(1, 3)
    # Called from: func(1, 3)
    debug at #1: [1] 1
    c. <- carb
    g. <- gear
    with(mtcars, { gear == as.numeric(gear) & carb == as.numeric(carb); })
    #  [1] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
    # [16] TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE TRUE
    # [31] TRUE TRUE
    with(mtcars, { gear == as.numeric(g.) & carb == as.numeric(c.); })
    #  [1] FALSE FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE
    # [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE
    # [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
    

答案 1 :(得分:0)

只需用!!取消引号即可:

function(carb,gear) {
  mtcars %>% filter(gear == as.numeric(!! gear),
                    carb == as.numeric(!! carb)) %>% 
    jsonlite::toJSON()

}

请参见programming with dplyr