如何删除大数据帧中丢失的数据

时间:2013-05-13 15:32:49

标签: r dataframe

我有一个大型data.frame,如果code1code2以及code3丢失,那么我将删除

DATE        BIRTHDAY     ID   code1  code2  code3   ID_SEX
19970406    19501022     1      32     4      2        F
19980508    19501022     1                             F
19980508    19501022     1       2     56     43       F
19990805    19500502     2       23    56              M
20000321    19500502     2       4                     M
20060715    19500322     3                             F

我想要这个

DATE        BIRTHDAY     ID   code1  code2  code3   ID_SEX
19970406    19501022     1      32     4      2        F
19980508    19501022     1       2     56     43       F
19990805    19500502     2       23    56              M
20000321    19500502     2       4                     M

id可以由rep。

1 个答案:

答案 0 :(得分:2)

假设您调用data.frame mydata

mydata[ 
  apply( mydata[ c("code1", "code2", "code3") ], 1, function(x){
    ! all( is.na( x ) )
  }),
]

修改

考虑Justins评论,以防您的代码列不是数字但类型为characterfactor,缺少的值实际上不是NA s而是空字符串({{1您可以使用

捕获所需的行
""