我有一个分析,我有时想在一组列上执行,有时希望在另一组相似的列上执行。分析足够长,以至于更改代码中的所有列名称都很繁琐。
我想到的解决方案是创建一个包含我正在使用的列的名称的变量,然后只引用该变量。但是,dplyr函数似乎无法从变量中提取列名。
例如
df = data.frame(color = c(rep("blue", 5), rep("red", 5)) ,
raw.values = rnorm(10), adjusted.values = rnorm(10)))
column_to_use <- "raw.values"
cool_analysis <- df %>%
group_by(color) %>%
summarise(mean = mean(column_to_use))
如果这样有效,我可以更改column_to_use
,而不必在引用raw.values
的整个分析中随处更改。不幸的是,dplyr不知道如何处理该对象。有没有办法使这项工作?