Question

例如，我想在名为＆＃34; data＆＃34;的数据集中对所有表示为NA的值进行子集化或条件化。在＆＃34; x＆＃34;的列中。怎么做？我尝试了以下代码，但它给了我0个观察结果。

NA1 <- subset(data, data$x==NA)

谢谢！

Answer 1

data.table包可以是一个非常方便的工具来处理数据集。特别是如果你工作的数据很大。

假设您有一个包含两个变量的数据表，其中一个变量具有NA值

> DT = data.table(var1=c(1,NA,3,NA), var2=c(5,6,7,8))
> DT
   var1 var2
1:    1    5
2:   NA    6
3:    3    7
4:   NA    8

然后，您只需使用which()命令查找NAs的子集或应用＆＃39; not＆＃39;前面的!which()运算符用于对var1中没有NAs的行进行分组。

> DT[which(is.na(var1))]
   var1 var2
1:   NA    6
2:   NA    8

指出上述语句只会打印结果，不会对原始数据表进行任何更改。

Here您可以在data.table找到精彩的常见问题解答。