用均值替换缺失值

时间:2017-08-28 15:11:02

标签: r data-cleaning

请帮助我理解以下语法:

我试图将NA与可用数据的平均值相匹配,但无法理解以下语法,有人请帮助我理解下面的语法。

data$Age[is.na(data$Age)] <- mean(data$Age,na.rm=T)

1 个答案:

答案 0 :(得分:-1)

data$Age[is.na(data$Age)] <- mean(data$Age,na.rm=T)

解释

右侧RHS

data$Age - 引用data.frame Age中的datamean(data$Age,na.rm=T) - 计算列忽略值等于NA

的列的平均值

左侧LHS

is.na(data$Age) - 返回TRUE / FALSE向量,其中data$Age等于NA;这对应于NA列中包含Age的行 <- - 为LHS分配在RHS上计算的值 data$Age[is.na(data$Age)] <- - 对于上面为真的data$Age,请在RHS上指定值