Question

我的数据看起来像这样：

db <- as.data.frame(matrix(ncol=10, nrow=3, 
                           c(3,NA,NA,4,5,NA,7,NA,NA,NA,NA,NA,7,NA,8,9,NA,NA,4,6,NA,NA,7,8,11,5,10,NA,NA,NA), byrow = TRUE))

db
  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
1  3 NA NA  4  5 NA  7 NA NA  NA
2 NA NA  7 NA  8  9 NA NA  4   6
3 NA NA  7  8 11  5 10 NA NA  NA

对于每一行，我试图计算在第一个和最后一个非NA元素（我有数字和字符）按行之间出现的NA数量。

输出应该是这样的：

db$na.tot <- c(3, 3, 0)
db
  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 na.tot
1  3 NA NA  4  5 NA  7 NA NA  NA      3
2 NA NA  7 NA  8  9 NA NA  4   6      3
3 NA NA  7  8 11  5 10 NA NA  NA      0

其中na.tot表示在行的第一个和最后一个非NA元素之间观察到的NA的数量（分别在行1,2和3中的3和7,7和6以及7和10之间）。

有没有人有一个简单的解决方案？

谢谢！

Answer 1

试试这个：

require(data.table)
z<-as.data.table(which(!is.na(db),arr.ind=TRUE))
setkey(z,row,col)
z[,list(NAs=last(col)-first(col)-.N+1),by=row]
#   row NAs
#1:   1   3
#2:   2   3
#3:   3   0

在R中按行计算2个值之间的NA数

1 个答案: