一个新手问题:我有一个数据框,包含7,000个15个变量和800个NA
值的观察值。
我已经找到了如何识别具有4个或更多NA
值的行:
DF[rowSums(is.na(DF)) >= 4, ]
,但我想删除NA
中包含4个或更多DF
个值的记录。如果这是最好的方式,有人可以告诉我在哪里放na.rm = T
吗?
非常感谢,我是R
的新手并且看了看......
答案 0 :(得分:1)
您的条件标识要省略的行。将其否定为要保留的行的ID,然后将结果存储在变量(或另一个)中:
DF <- DF[!(rowSums(is.na(DF)) >= 4), ]