可能重复:
Set NA to 0 in R
我有一个data.frame,其列值为NA
。我想将NA
替换为0
或任何其他值。我尝试了很多线程和方法,但它没有给我结果。我尝试过以下方法。
a$x[a$x==NA]<-0;
a[,c("x")]<-apply(a[,c("x")],1,function(z){replace(z, is.na(z), 0)});
a$x[is.na(a$x),]<-0;
对于data.frame NA
,上述方法均未将x
替换为a
列中的0。为什么呢?
答案 0 :(得分:60)
因为到目前为止还没有人指出为什么你正在尝试的东西不起作用:
NA == NA
不返回TRUE
,它返回NA
(因为与未定义的值进行比较会产生未定义的结果)。 apply
。您无法使用apply
循环遍历列中的元素。 a$x
,这只是列(原子向量)。我要修正3.到达a$x[is.na(a$x)] <- 0
答案 1 :(得分:7)
首先,这是一些示例数据:
set.seed(1)
dat <- data.frame(one = rnorm(15),
two = sample(LETTERS, 15),
three = rnorm(15),
four = runif(15))
dat <- data.frame(lapply(dat, function(x) { x[sample(15, 5)] <- NA; x }))
head(dat)
# one two three four
# 1 NA M 0.80418951 0.8921983
# 2 0.1836433 O -0.05710677 NA
# 3 -0.8356286 L 0.50360797 0.3899895
# 4 NA E NA NA
# 5 0.3295078 S NA 0.9606180
# 6 -0.8204684 <NA> -1.28459935 0.4346595
这是我们的替代品:
dat[["four"]][is.na(dat[["four"]])] <- 0
head(dat)
# one two three four
# 1 NA M 0.80418951 0.8921983
# 2 0.1836433 O -0.05710677 0.0000000
# 3 -0.8356286 L 0.50360797 0.3899895
# 4 NA E NA 0.0000000
# 5 0.3295078 S NA 0.9606180
# 6 -0.8204684 <NA> -1.28459935 0.4346595
或者,您当然可以写dat$four[is.na(dat$four)] <- 0