Question

我有一个6,000 obs的data.frame

SubjectID  : int   1,2,3,4...
Arthritis  : logi  FALSE FALSE TRUE FALSE FALSE
Stroke     : logi  TRUE FALSE FALSE FALSE FALSE
Diabetes   : logi  TRUE FALSE FALSE FALSE FALSE
Cancer     : logi  FALSE FALSE FALSE FALSE TRUE

我试图找到每种疾病都不存在的行。我可以用这个来治疗一种疾病：

subset(RHV.FINAL, Arthritis=="FALSE")

我已经为所有疾病尝试过这种方法，但是很麻烦：

subset(RHV.FINAL, Arthritis=="FALSE" & Stroke=="FALSE" & Diabetes=="FALSE" & Cancer=="FALSE")

是否有更有说服力的解决方案？

Answer 1

你能否使用rowSums？你发布它的数据str很难说清楚。在R会话中重新创建的一个小例子很好（dput）。

df [rowSums( df ) == 0 , ]

例如......

set.seed(123)
df <- data.frame( id = 1:5,
            A = sample( c(T,F) , 5 , repl = T ),
            B = sample( c(T,F) , 5 , repl = T ),
            C = sample( c(T,F) , 5 , repl = T ))

  id     A     B     C
1  1  TRUE  TRUE FALSE
2  2 FALSE FALSE  TRUE
3  3  TRUE FALSE FALSE
4  4 FALSE FALSE FALSE
5  5 FALSE  TRUE  TRUE


# df[,-1] to exclude id variable in first column (thanks @DidzisElferts)
df[ rowSums(df[,-1]) == 0 , ] 
  id     A     B     C
4  4 FALSE FALSE FALSE

满足数据框中的每个逻辑条件

1 个答案: