我有一个6,000 obs的data.frame
SubjectID : int 1,2,3,4...
Arthritis : logi FALSE FALSE TRUE FALSE FALSE
Stroke : logi TRUE FALSE FALSE FALSE FALSE
Diabetes : logi TRUE FALSE FALSE FALSE FALSE
Cancer : logi FALSE FALSE FALSE FALSE TRUE
我试图找到每种疾病都不存在的行。我可以用这个来治疗一种疾病:
subset(RHV.FINAL, Arthritis=="FALSE")
我已经为所有疾病尝试过这种方法,但是很麻烦:
subset(RHV.FINAL, Arthritis=="FALSE" & Stroke=="FALSE" & Diabetes=="FALSE" & Cancer=="FALSE")
是否有更有说服力的解决方案?
答案 0 :(得分:3)
你能否使用rowSums
?你发布它的数据str
很难说清楚。在R会话中重新创建的一个小例子很好(dput
)。
df [rowSums( df ) == 0 , ]
例如......
set.seed(123)
df <- data.frame( id = 1:5,
A = sample( c(T,F) , 5 , repl = T ),
B = sample( c(T,F) , 5 , repl = T ),
C = sample( c(T,F) , 5 , repl = T ))
id A B C
1 1 TRUE TRUE FALSE
2 2 FALSE FALSE TRUE
3 3 TRUE FALSE FALSE
4 4 FALSE FALSE FALSE
5 5 FALSE TRUE TRUE
# df[,-1] to exclude id variable in first column (thanks @DidzisElferts)
df[ rowSums(df[,-1]) == 0 , ]
id A B C
4 4 FALSE FALSE FALSE