选择data.table中至少有一个缺失值(NA)的行

时间:2017-06-18 19:06:49

标签: r data.table na

在数据表中选择具有至少一个NA值的多个变量的行的便捷方法是什么。我找到了一种方法,但如果有很多变量可供选择,那就不方便了。

以下是工作示例:

library(data.table)

# Create a data table 
DT <- data.table(V1=1:5, V2=LETTERS[1:5])

# Insert some missing values
DT[c(1,3),V1 := NA]
DT[c(1,2),V2 := NA]

# Check the output
print(DT)

   V1 V2
1: NA NA
2:  2 NA
3: NA  C
4:  4  D
5:  5  E

# Select if there is at least one NA:
# My solution:

myDT <- DT[is.na(V1) | is.na(V2), ]

# Check output
print(myDT)

   V1 V2
1: NA NA
2:  2 NA
3: NA  C

所以这个解决方案有效,但如果有更多变量(V1,V2,V3,...),就不方便了。

有更好的方法吗?

1 个答案:

答案 0 :(得分:3)

使用complete.cases,然后采用相反的方式。

myDT <- DT[!complete.cases(V1,V2), ]