R在矩阵中替换NA

时间:2012-06-21 14:43:15

标签: r

在R中的

我有一个包含一些缺失值的数据框,因此read.table()函数使用NA而不是空白单元格。

我写了这个:

a <- sample(1000:50000000, size=120, replace=TRUE)
values <- matrix(a, nrow=6, ncol=20)
mtx <- cbind.data.frame(values, c(rep(NA),6))
mtx <- apply(mtx, 2, function(x){
    if (x==NA) sample(100:500, replace=TRUE, size=nrow(mtx)) else (x)})

但我有这个错误:

Error in if (x == NA) sample(100:500, replace = TRUE, size = nrow(mtx)) else (x) : 
  missing value where TRUE/FALSE needed
In addition: Warning message:
In if (x == NA) sample(100:500, replace = TRUE, size = nrow(mtx)) else (x) :
  the condition has length > 1 and only the first element will be used

有什么想法吗?

最佳

的Riccardo

1 个答案:

答案 0 :(得分:7)

您无法使用比较运算符测试NA,因为值为NA或缺失。 is.na()是以NA形式识别缺失的适当函数。

以下是替换矩阵NA中的values的示例。这里的关键是以矢量化方式工作,只需确定哪些元素为NA,然后使用to索引以用所需的值替换所有NA

> set.seed(2)
> values <- matrix(sample(1000:50000000, size=120, replace=TRUE),
+                  nrow=6, ncol=20)
> ## add some NA to simulate
> values[sample(120, 20)] <- NA
> 
> ## how many NA
> (tot <- sum(is.na(values)))
[1] 20
> 
> ## replace the NA
> values[is.na(values)] <- sample(100:500, tot, replace=TRUE)
> 
> ## now how many NA
> (sum(is.na(values)))
[1] 0