如果另一列包含值,则过滤列值

时间:2020-04-06 23:15:03

标签: r filter dplyr conditional-statements

基本上,如果另一列包含值,我想过滤一列。这是一个示例:

my_df <- data.frame(x = c(1,1,1,2,2,2),
           y = c(1,2,3,4,5,6)) 
> my_df
  x y
1 1 1
2 1 2
3 1 3
4 2 4
5 2 5
6 2 6

当且仅当x!=1时才过滤y!=1。这是我的预期结果:

  x y
1 1 1
2 2 4
3 2 5
4 2 6

1 个答案:

答案 0 :(得分:1)

我们可以在此处使用group_by filter

library(dplyr)
my_df %>%
   group_by(x) %>% 
   filter(if(any(y == 1)) y == 1 else TRUE)
# A tibble: 4 x 2
# Groups:   x [2]
#      x     y
#  <dbl> <dbl>
#1     1     1
#2     2     4
#3     2     5
#4     2     6

或者如果不需要分组的话

my_df %>%
   filter( (x == 1 & y == 1)|(x !=1))

或与subset

subset(my_df,  (x == 1 & y == 1)|(x !=1))
#  x y
#1 1 1
#4 2 4
#5 2 5
#6 2 6

subset(my_df,  (x == 1 & y == 1)|(x !=1 & y != 1))