我有两套训练集和测试集,有些值是NA,我需要R语言中的代码或指导,为NA设置值。 谢谢....
答案 0 :(得分:0)
df <- data.frame(a = sample(c(NA, 1:5),10, replace = T))
a
5
5
3
2
NA
5
1
NA
5
4
现在用任何值替换NA。请注意,在这种情况下,我将所有NA's
替换为0
df[is.na(df)] <- 0
<强>结果强>
a
5
5
3
2
0
5
1
0
5
4
答案 1 :(得分:0)
您在后续评论中询问是否可以使用零以外的值替换NA&#39; s。您可以。一种方法是平均估算(以下代码来自r博主:
df = data.frame(x = 1:20, y = c(1:10,rep(NA,10)))
df$y[is.na(df$y)] = mean(df$y, na.rm=TRUE)
您必须了解平均估算是否适合您的数据(或以此方式进行任何其他估算)short blog post on problems with mean imputation
请谨慎使用。