过滤掉仅包含特定信息的组 - R.

时间:2018-02-23 20:43:04

标签: r

我正在尝试过滤掉不包含至少一个父母和一个孩子的家庭号码中的参与者,并且家庭号码必须至少有两个参与者,即在这种情况下我想删除family_number 2。

Participant   Family_number    Family_member
A             1                Child
B             1                Parent
C             2                Child
D             2                Child
E             3                Parent
F             3                Child
G             3                Child

由于我想使用dplyr,我尝试过使用group_by()和filter()但是我最终没有数据或得到错误。

任何提示?

谢谢,

朱莉娅

1 个答案:

答案 0 :(得分:0)

像这样,例如?

library(tidyverse)
dat %>% group_by(Family_number) %>% 
  filter(sum(Family_member == "Parent") >= 1 & sum(Family_member == "Child") >= 1)

# A tibble: 5 x 3
# Groups:   Family_number [2]
  Participant Family_number Family_member
  <fct>               <dbl> <fct>        
1 A                    1.00 Child        
2 B                    1.00 Parent       
3 E                    3.00 Parent       
4 F                    3.00 Child        
5 G                    3.00 Child