函数中的dplyr和ggplot:在aes函数中使用重新排序

时间:2016-03-11 05:50:40

标签: r ggplot2 dplyr

我正在努力重新排序我的数据,以便在使用dplyr的函数中使用ggplot绘图:

# example data
library(ggplot2)
library(dplyr)
dat <- data.frame(a = c(rep("l", 10), rep("m", 5), rep("o", 15)),
                  b = sample(100, 30), 
                  c= c(rep("q", 10), rep("r", 5), rep("s", 15)))

以下是我在函数之外的步骤:

# set a variable
colm <- "a"
# make a table
dat1 <- dat %>% 
  group_by_(colm) %>%  
  tally(sort = TRUE)
# put in order and plot
ggplot(dat2, aes(x = reorder(a, n), y = n)) +
  geom_bar(stat = "identity")

enter image description here

但是当我尝试将其变成一个函数时,我似乎无法使用reorder

f <-  function(the_data, the_column){
       dat %>% group_by_(the_column) %>%  
       tally(sort = TRUE) %>% 
       ggplot(aes_string(x = reorder(the_column, 'n'), y = 'n')) +
       geom_bar(stat = "identity")
}

f(dat, "a")

Warning message:
In mean.default(X[[i]], ...) :
  argument is not numeric or logical: returning NA

enter image description here

该功能无需reorder

f <-  function(the_data, the_column){
       dat %>% group_by_(the_column) %>%  
       tally(sort = TRUE) %>% 
       ggplot(aes_string(x = the_column, y = 'n')) +
       geom_bar(stat = "identity")
}

f(dat, "a")

enter image description here

我可以在没有dplyr的情况下得到我想要的东西,但我更喜欢使用dplyr,因为它在我的实际使用情况下效率更高:

# without dplyr
ff = function(the_data, the_column) {
  data.frame(table(the_data[the_column])) %>% 
  ggplot(aes(x = reorder(Var1, Freq), y = Freq)) +
  geom_bar(stat = "identity") +
    ylab("n") +
    xlab(the_column)
}

ff(dat, "a")

enter image description here

我看到其他人一直在努力解决这个问题(12),但似乎必须有一个更有效的dplyr / pipe习惯用于这个重新排序的函数任务。

1 个答案:

答案 0 :(得分:7)

如果您要使用aes_string,那么整个值必须是一个字符串,而不仅仅是一个字符串。您可以使用paste()来帮助构建要用于x的表达式。例如

f <-  function(the_data, the_column){
       dat %>% group_by_(the_column) %>%  
       tally(sort = TRUE) %>% 
       ggplot(aes_string(x = paste0("reorder(",the_column,", n)"), y = 'n')) +
       geom_bar(stat = "identity")
}

或者你可以使用表达式而不是字符串

f <-  function(the_data, the_column){
       dat %>% group_by_(the_column) %>%  
       tally(sort = TRUE) %>% 
       ggplot(aes_q(x = substitute(reorder(x, n),list(x=as.name(the_column))), y = quote(n))) +
       geom_bar(stat = "identity")
}

但一般的想法是,在混合字符串和原始语言元素(如名称或表达式)时需要小心。