我的目标是从mydata中选择包含某些模式的几个列。
mydata <- data.frame(q1 = rnorm(10), q10 = rnorm(10), q12 = rnorm(10), q20 = rnorm(10))
方法1 - 使用grep - 以简约的方式做我需要的东西:
myvars <- names(mydata)[grep("^q10|^q12", names(mydata))]
temp <- mydata[myvars]
tbl_df(temp)
我试图在dplyr中完全做到这一点。但是,我找不到比( 代码太多了。我怎样才能使用&#34; |&#34;?我尝试了以下但没有一个工作: 么?
谢谢!temp <- cbind(select(mydata, starts_with("q10")), select(mydata, starts_with("q12")))
tbl_df(temp)
select(mydata, starts_with("q10|q12"))
select(mydata, starts_with(c("q10","q12")))
temp <- select(mydata, starts_with("q10","q12"))
select(mydata, starts_with(c("q10"))|starts_with(c("q12")))
答案 0 :(得分:5)
从select()
帮助文件中,我发现接受正则表达式的唯一特殊内部函数是matches()
。您可以使用正则表达式^q1(0|2)
从名称的开头开始,并将q1
与0
或2
匹配。
select(mydata, matches("^q1(0|2)"))
# q10 q12
# 1 -0.97766671 1.2691732
# 2 -1.17397582 -0.8175758
# 3 -1.98684643 0.1117284
# 4 1.12142980 0.5737528
# 5 0.41680505 0.8974448
# 6 1.47558382 -1.5122752
# 7 0.39651297 -0.5282083
# 8 -0.13266148 0.8281671
# 9 -0.66982395 0.1239249
# 10 0.06119857 -0.3484675