我有一个包含一些缺失值的数据框,因此read.table()
函数使用NA
而不是空白单元格。
我写了这个:
a <- sample(1000:50000000, size=120, replace=TRUE)
values <- matrix(a, nrow=6, ncol=20)
mtx <- cbind.data.frame(values, c(rep(NA),6))
mtx <- apply(mtx, 2, function(x){
if (x==NA) sample(100:500, replace=TRUE, size=nrow(mtx)) else (x)})
但我有这个错误:
Error in if (x == NA) sample(100:500, replace = TRUE, size = nrow(mtx)) else (x) :
missing value where TRUE/FALSE needed
In addition: Warning message:
In if (x == NA) sample(100:500, replace = TRUE, size = nrow(mtx)) else (x) :
the condition has length > 1 and only the first element will be used
有什么想法吗?
最佳的Riccardo
答案 0 :(得分:7)
您无法使用比较运算符测试NA
,因为值为NA
或缺失。 is.na()
是以NA
形式识别缺失的适当函数。
以下是替换矩阵NA
中的values
的示例。这里的关键是以矢量化方式工作,只需确定哪些元素为NA
,然后使用to索引以用所需的值替换所有NA
。
> set.seed(2)
> values <- matrix(sample(1000:50000000, size=120, replace=TRUE),
+ nrow=6, ncol=20)
> ## add some NA to simulate
> values[sample(120, 20)] <- NA
>
> ## how many NA
> (tot <- sum(is.na(values)))
[1] 20
>
> ## replace the NA
> values[is.na(values)] <- sample(100:500, tot, replace=TRUE)
>
> ## now how many NA
> (sum(is.na(values)))
[1] 0