我们如何在R中设置缺失数据(NA)?

时间:2018-04-03 13:54:37

标签: r data-mining

我有两套训练集和测试集,有些值是NA,我需要R语言中的代码或指导,为NA设置值。 谢谢....

2 个答案:

答案 0 :(得分:0)

df <- data.frame(a = sample(c(NA, 1:5),10, replace = T))

  a
  5
  5
  3
  2
 NA
  5
  1
 NA
  5
  4

现在用任何值替换NA。请注意,在这种情况下,我将所有NA's替换为0

df[is.na(df)] <- 0

<强>结果

 a
 5
 5
 3
 2
 0
 5
 1
 0
 5
 4

答案 1 :(得分:0)

您在后续评论中询问是否可以使用零以外的值替换NA&#39; s。您可以。一种方法是平均估算(以下代码来自r博主:

df = data.frame(x = 1:20, y = c(1:10,rep(NA,10)))
df$y[is.na(df$y)] = mean(df$y, na.rm=TRUE)

您必须了解平均估算是否适合您的数据(或以此方式进行任何其他估算)short blog post on problems with mean imputation

请谨慎使用。