在数据表中选择具有至少一个NA值的多个变量的行的便捷方法是什么。我找到了一种方法,但如果有很多变量可供选择,那就不方便了。
以下是工作示例:
library(data.table)
# Create a data table
DT <- data.table(V1=1:5, V2=LETTERS[1:5])
# Insert some missing values
DT[c(1,3),V1 := NA]
DT[c(1,2),V2 := NA]
# Check the output
print(DT)
V1 V2
1: NA NA
2: 2 NA
3: NA C
4: 4 D
5: 5 E
# Select if there is at least one NA:
# My solution:
myDT <- DT[is.na(V1) | is.na(V2), ]
# Check output
print(myDT)
V1 V2
1: NA NA
2: 2 NA
3: NA C
所以这个解决方案有效,但如果有更多变量(V1,V2,V3,...),就不方便了。
有更好的方法吗?
答案 0 :(得分:3)
使用complete.cases
,然后采用相反的方式。
myDT <- DT[!complete.cases(V1,V2), ]