dplyr:使用链接来传递变量

时间:2014-11-03 13:33:25

标签: r dplyr chain stringr

我是dplyr的新手,无法弄清楚如何控制变量以通过链接(%>%)命令。简单的例子:str_sub函数有三个参数 - 第一个是通过%>%传递的,但我怎样才能得到最后两个? :

library(stringr)
library(dplyr)
df <- data.frame(V1 = c("ABBEDHH", "DEFGH", "EFGF", "EEFD"), 
                 V2=c(4, 2, 1, 1), V3=c(5, 2, 2, 1), stringsAsFactors=FALSE)

在基地R我能做到:

with(df, str_sub(V1, V2, V3))

并获得:

## [1] "ED" "E"  "EF" "E" 

如何链接这个? - 我试过了:

df %>% str_sub(V1, V2, V3) # Here V3 is unused arg since V1 is treated as 2nd arg

df %>% select(V1) %>% str_sub(V2, V3) # Here V2 and V3 are not recognized

2 个答案:

答案 0 :(得分:5)

您可以执行以下操作:

library(dplyr)
library(stringr)
library(lazyeval)

df %>% mutate(new = str_sub(V1, V2, V3))
#       V1 V2 V3 new
#1 ABBEDHH  4  5  ED
#2   DEFGH  2  2   E
#3    EFGF  1  2  EF
#4    EEFD  1  1   E

请注意,dplyr用于处理data.frame s,因此输入和输出应该是data.frames,而不是原子向量。

答案 1 :(得分:1)

也可以这样做:

df %>% with(str_sub(V1, V2, V3))

因为你想要一个矢量。但现在我们回到了嵌套的土地上。