我想计算data.table
中缺失值的数量。
require(data.table)
DT <- data.table(kkey = 1:10, data = (1:10)^2)
for (i in 1:2) set(DT, sample(10, i+3), i, NA)
> DT
kkey data
1: 1 NA
2: NA 4
3: 3 NA
4: 4 16
5: NA NA
6: 6 36
7: NA NA
8: 8 NA
9: 9 81
10: NA 100
我可以获得我想要的信息:
DT[, c('missing.values.in.kkey', 'missing.values.in.data') :=
lapply(.SD, function(x) sum(is.na(x)))]
或
summary(DT)
或
lapply(DT, function(x) sum(is.na(x)))
$kkey
[1] 4
$data
[1] 5
但是如何创建一个简单的data.table,data.table
方式?:
missing.kkey missing.data
1: 4 5