将函数参数传递给dplyr和ggplot

时间:2017-08-01 13:52:27

标签: r ggplot2 dplyr rlang tidyeval

我对如何将函数参数传递给dplyr和ggplot代码感到困惑。 我正在使用最新版本的dplyr和ggplot2 这是我制作条形图的代码(清晰度与平均价格)

diamond.plot<- function (data, group, metric) {
    group<- quo(group)
    metric<- quo(metric)
    data() %>% group_by(!! group) %>%
           summarise(price=mean(!! metric)) %>% 
           ggplot(aes(x=!! group,y=price))+
           geom_bar(stat='identity') 
}

diamond.plot(diamonds, group='clarity', metric='price')

错误:

Error in UseMethod("group_by_") : no applicable method for 'group_by_' applied to an object of class "packageIQR"

对于最新版本的dplyr,强调不推荐使用强调的verbs_()。我们似乎应该使用quosures。

我的问题:

  • 有人可以澄清目前的最佳做法吗?
  • 上面的代码出了什么问题? (请不要使用下划线dplyr动词..)

  • 在ggplot中,我知道我们可以使用aes_string(),但在我的情况下,只有一个参数在aes中从函数参数传递。

提前致谢。

5 个答案:

答案 0 :(得分:6)

由于ggplot2不支持tidyeval语法,但我认为你还不能采用“正确”的方法,但它已经到来了。

代码的dplyr部分的最佳实践是:

library(tidyverse)
library(rlang)

diamond_data <- function (data, group, metric) {
   quo_group <- enquo(group)
   quo_metric <- enquo(metric)
   data %>%
     group_by(!!quo_group) %>%
     summarise(price=mean(!!quo_metric))
}
diamond_data(diamonds, clarity, price)

要解决ggplot2中tidyeval缺乏支持的问题,你可以这样做(注意函数调用中变量的引号):

diamond_plot <- function (data, group, metric) {
    quo_group <- parse_quosure(group)
    quo_metric <- parse_quosure(metric)
    data %>%
        group_by(!!quo_group) %>%
        summarise(price=mean(!!quo_metric)) %>%
        ggplot(aes_(x = as.name(group), y=as.name(metric)))+
        geom_bar(stat='identity')
}
diamond_plot(diamonds, "clarity", "price")

编辑 - 关注@ lionel的评论:

diamond_plot <- function (data, group, metric) {
    quo_group <- sym(group)
    quo_metric <- sym(metric)
    data %>%
        group_by(!!quo_group) %>%
        summarise(price=mean(!!quo_metric)) %>%
        ggplot(aes_(x = quo_group, y= quo_metric)) +
        geom_bar(stat='identity')
}
diamond_plot(diamonds, "clarity", "price")

答案 1 :(得分:3)

sinQueso的答案很有希望,但它错过了一个功能的目的,它可以适应不同的数据帧。 &#34;价格&#34;变量在以下行的函数中编码:

summarise(price=mean(!!quo_metric)) %>%

所以这个函数只有在输入变量为&#34; price&#34;时才有效。

这是一个更好的解决方案,可用于任何数据框:

diamond_plot <- function (data, group, metric) {
        quo_group <- sym(group)
        quo_metric <- sym(metric)
        summary <- data %>%
                group_by(!!quo_group) %>%
                summarise(mean=mean(!!quo_metric))
                ggplot(summary, aes_string(x = group, y= "mean")) +
                geom_bar(stat='identity')
}
diamond_plot(diamonds, "clarity", "price")

答案 2 :(得分:3)

您可以比Daniel的解决方案更进一步,以便摘要变量(公制)的名称随输入而变化。

diamond_plot <- function(data, group, metric) {
    quo_group <- rlang::sym(group)
    quo_metric <- rlang::sym(metric)
    metric_name <- rlang::sym(stringr::str_c("mean_", metric))
    data %>%
        group_by(!!quo_group) %>%
        summarize(!!metric_name := mean(!!quo_metric)) %>%
        ggplot(aes_(x = quo_group, y = metric_name)) +
        geom_bar(stat = 'identity')
}
diamond_plot(diamonds, "clarity", "price")

答案 3 :(得分:3)

最多&#34; tidyeval&#34;对我来说这个问题的方法看起来像是quo_nameaes_string函数的组合。避免使用aes_之类的尾随下划线动词,因为它们已被弃用。

diamond_plot <- function(data, group, metric) {
  quo_group <- enquo(group)
  str_group <- quo_name(quo_group)

  quo_metric <- enquo(metric)

  summary <- data %>%
     groupby(!!quo_group) %>%
     summarise(mean = mean(!!quo_metric))

  ggplot(summary) +
  geom_bar(aes_string(x = str_group, y = "mean"), stat = "identity")
}

diamond_plot(diamnonds, clarity, price)

答案 4 :(得分:3)

ggplot2 v3.0.0现在完全支持整洁评估,因此无需再使用aes_aes_string

library(rlang)
library(tidyverse)

diamond_plot <- function (data, group, metric) {
    quo_group  <- sym(group)
    quo_metric <- sym(metric)

    data %>%
        group_by(!! quo_group) %>%
        summarise(price = mean(!! quo_metric)) %>%
        ggplot(aes(x = !! quo_group, y = !! quo_metric)) +
        geom_col()
}

diamond_plot(diamonds, "clarity", "price")

reprex package(v0.2.0)创建于2018-04-16。