如何在管道(R)中使用变量名称引用tibble列

时间:2017-03-17 05:36:09

标签: r variables pipe refer

我对R很新,所以这个问题可能有点天真。

我有一些包含多个列的元素,我想通过将N个列中的一列中的值分箱来创建一个因子(Bin)。这是在管道中完成的。但是,我希望能够在脚本的顶部定义要分箱的列(例如bin2use = RT),因为我希望这是灵活的。

我已尝试过几种使用此变量引用列名的方法,但我无法使其工作。其中我尝试过get(),eval(),[[]]

简化示例代码

Subject <- c(rep(1,100), rep(2,100))
RT <- runif(200, 300, 800 )
data_st <- tibble(Subject, RT)

bin2use = 'RT'
nbin = 5

binned_data <- data_st %>%
  group_by(Subject) %>%
  mutate(
    Bin = cut_number(get(bin2use), nbin, label = F)
  )

Error in mutate_impl(.data, dots) : 
  non-numeric argument to binary operator

1 个答案:

答案 0 :(得分:0)

我们可以使用`lazyeval

进行非标准评估
library(dplyr)
library(ggplot2)
f1 <- function(colName, bin){
     call <- lazyeval::interp(~cut_number(a, b, label = FALSE),
                        a = as.name(colName), b = bin)
     data_st %>%
           group_by(Subject) %>% 
           mutate_(.dots = setNames(list(call), "Bin"))
} 

f1(bin2use, nbin)
#Source: local data frame [200 x 3]
#Groups: Subject [2]

#   Subject       RT   Bin
#     <dbl>    <dbl> <int>
#1        1 752.2066     5
#2        1 353.0410     1
#3        1 676.5617     4
#4        1 493.0052     2
#5        1 532.2157     3
#6        1 467.5940     2
#7        1 791.6643     5
#8        1 333.1583     1
#9        1 342.5786     1
#10       1 637.8601     4
# ... with 190 more rows