例如,我想在名为" data"的数据集中对所有表示为NA的值进行子集化或条件化。在" x"的列中。怎么做? 我尝试了以下代码,但它给了我0个观察结果。
NA1 <- subset(data, data$x==NA)
谢谢!
答案 0 :(得分:0)
data.table
包可以是一个非常方便的工具来处理数据集。特别是如果你工作的数据很大。
假设您有一个包含两个变量的数据表,其中一个变量具有NA
值
> DT = data.table(var1=c(1,NA,3,NA), var2=c(5,6,7,8))
> DT
var1 var2
1: 1 5
2: NA 6
3: 3 7
4: NA 8
然后,您只需使用which()
命令查找NAs
的子集或应用&#39; not&#39;前面的!which()
运算符用于对var1中没有NAs
的行进行分组。
> DT[which(is.na(var1))]
var1 var2
1: NA 6
2: NA 8
指出上述语句只会打印结果,不会对原始数据表进行任何更改。
Here您可以在data.table
找到精彩的常见问题解答。