使用data.table在简单表中汇总每列的缺失值

时间:2016-02-11 19:08:49

标签: r data.table

我想计算data.table中缺失值的数量。

require(data.table)
DT <- data.table(kkey = 1:10, data = (1:10)^2)
for (i in 1:2) set(DT, sample(10, i+3), i, NA)
> DT
    kkey data
 1:    1   NA
 2:   NA    4
 3:    3   NA
 4:    4   16
 5:   NA   NA
 6:    6   36
 7:   NA   NA
 8:    8   NA
 9:    9   81
10:   NA  100

我可以获得我想要的信息:

DT[, c('missing.values.in.kkey', 'missing.values.in.data') := 
     lapply(.SD, function(x) sum(is.na(x)))]

summary(DT)

lapply(DT, function(x) sum(is.na(x)))
$kkey
[1] 4

$data
[1] 5

但是如何创建一个简单的data.table,data.table方式?:

      missing.kkey  missing.data
1:               4             5

0 个答案:

没有答案