如何使用dplyr基于字符串选择列

时间:2017-04-26 05:21:24

标签: r dplyr

我可以选择并重命名列名,没有任何问题:


library(tidyverse)
iris <- as.tibble(iris)
iris %>% select(sepal_ln = Sepal.Length, sepal_wd = Sepal.Width)
#> # A tibble: 150 × 2
#>    sepal_ln sepal_wd
#>       <dbl>    <dbl>
#> 1       5.1      3.5
#> 2       4.9      3.0
#> 3       4.7      3.2
#> 4       4.6      3.1
#> 5       5.0      3.6
#> 6       5.4      3.9
#> 7       4.6      3.4
#> 8       5.0      3.4
#> 9       4.4      2.9
#> 10      4.9      3.1
#> # ... with 140 more rows

但是我想要做的是从字符串而不是列名称调用列。我尝试了以下但是失败了:

> wanted <- "Sepal"
> iris %>% select(sepal_ln = !! paste0(wanted,".Length"), 
+                 sepal_wd = !! paste0(wanted,".Width"), 
+ )
Error: "Sepal.Length", "Sepal.Width": must resolve to integer column positions, not string
> 

这样做的正确方法是什么?

1 个答案:

答案 0 :(得分:3)

我们可以使用select_

 iris %>% 
   select_(sepal_ln = paste0(wanted, ".Length"), paste0(wanted, ".Width"))

此外,select内有包装器可以更轻松地执行此操作,即one_ofcontainsmatches等,以便从数据中选择所需的列

iris %>% 
  select(setNames(one_of(paste0(wanted, c(".Length", ".Width"))),
                 c("sepal_ln", "sepal_wd"))) %>%
  head(2)
# A tibble: 2 × 2
#   sepal_ln sepal_wd
#     <dbl>    <dbl>
#1      5.1      3.5
#2      4.9      3.0

注意:目前尚不清楚select_方法是否会在下一个dplyr版本(0.6.0)中弃用。