我正在尝试过滤掉不包含至少一个父母和一个孩子的家庭号码中的参与者,并且家庭号码必须至少有两个参与者,即在这种情况下我想删除family_number 2。
Participant Family_number Family_member
A 1 Child
B 1 Parent
C 2 Child
D 2 Child
E 3 Parent
F 3 Child
G 3 Child
由于我想使用dplyr,我尝试过使用group_by()和filter()但是我最终没有数据或得到错误。
任何提示?
谢谢,
朱莉娅
答案 0 :(得分:0)
像这样,例如?
library(tidyverse)
dat %>% group_by(Family_number) %>%
filter(sum(Family_member == "Parent") >= 1 & sum(Family_member == "Child") >= 1)
# A tibble: 5 x 3
# Groups: Family_number [2]
Participant Family_number Family_member
<fct> <dbl> <fct>
1 A 1.00 Child
2 B 1.00 Parent
3 E 3.00 Parent
4 F 3.00 Child
5 G 3.00 Child