在dplyr中选择时使用否定的ends_with和starts_with

时间:2018-07-17 13:26:19

标签: r dplyr

说我有这个数据框:

df <- data.frame(foo = runif(10), bar = runif(10), boo = runif(10))

#          bar       boo        foo
# 1  0.9561519 0.2152603 0.90986454
# 2  0.9971676 0.8101082 0.78158207
# 3  0.6211555 0.9281131 0.59828786
# 4  0.2332080 0.6063427 0.88131253
# 5  0.6572534 0.3698642 0.61227246
# 6  0.6940809 0.1464231 0.30366349
# 7  0.3924425 0.3706134 0.05930352
# 8  0.7918689 0.8808447 0.90571744
# 9  0.2553619 0.9632559 0.52549238
# 10 0.3772701 0.7657140 0.05102249

选择这样的列时,我可以同时使用starts_withends_with

df %>% 
  select(intersect(starts_with("b"), ends_with("oo")))

如预期的那样,将给出以下内容:

#          boo
# 1  0.2152603
# 2  0.8101082
# 3  0.9281131
# 4  0.6063427
# 5  0.3698642
# 6  0.1464231
# 7  0.3706134
# 8  0.8808447
# 9  0.9632559
# 10 0.7657140

我还可以通过取反oo来选择不以ends_with结尾的列,例如:

df %>% 
  select(-ends_with("oo"))
#          bar
# 1  0.9561519
# 2  0.9971676
# 3  0.6211555
# 4  0.2332080
# 5  0.6572534
# 6  0.6940809
# 7  0.3924425
# 8  0.7918689
# 9  0.2553619
# 10 0.3772701

现在,我想结合这些行为。也就是说,我要oo结尾并以b开头的列。因此,在我的示例中,我应该只获取列bar –但不是。

df %>% 
  select(intersect(starts_with("b"), -ends_with("oo")))

# data frame with 0 columns and 10 rows

上面,我证明了intersect方法是可行的,而ends_with的否定也可以,但是将这些方法结合起来并不能得到我期望的结果。有人可以告诉我我要去哪里哪里吗?


编辑:实际上,既然我在一个新的会话中重新运行了此操作,

  

UseMethod(“ select_”)中的错误:     没有适用于“ select_”的适用方法应用于“函数”类的对象

1 个答案:

答案 0 :(得分:3)

使用setdiff

df %>% 
  select(setdiff(starts_with("b"), ends_with("oo")))

# bar
# 1  0.5248344
# 2  0.8835366
# 3  0.3486265
# 4  0.6382468
# 5  0.7378287
# 6  0.2878244
# 7  0.1927559
# 8  0.9787019
# 9  0.5393251
# 10 0.9229542

否定符号是select理解的魔法,intersect不理解。