使用R填充变量值

时间:2011-04-01 05:02:31

标签: r variables

我有一个大型数据集,需要填写一些缺失值。有没有办法用R填写缺失值。这是一个示例数据集:

aid weight  birth_date  number_born
1   121 10/02/2009  14
2   111 10/02/2009  NA
3   132 NA           12
4   145 14/02/2009  11
5   221 NA           NA
6   131 25/02/2009  10
7   231 25/02/2009  NA

需要填写以下信息:

Aid = 3, birth_date = 13/02/2009
Aid = 5, birth_date = 17/02/2009
Aid = 2, number_born = 6
Aid = 5, number_born = 16
Aid = 7, number_born = 5 

我希望我的问题足够清楚,任何帮助都会受到赞赏。

Poasa

1 个答案:

答案 0 :(得分:1)

如果data.frame df_with_missing中包含缺失值的数据,则填写data.frame fill_birth_date(fill_number_born)的数据。我认为辅助变量在df_with_missing中是唯一的。

aid birth_date
3 13/02/2009
5 17/02/2009

fill_birth_date$rec <- match(fill_birth_date$aid,df_with_missing$aid)
df_with_missing$birth_date[fill_birth_date$rec] <- fill_birth_date$birth_date

fill_number_born$rec <- match(fill_number_born$aid,df_with_missing$aid)
df_with_missing$number_born[fill_number_born$rec] <- fill_number_born$number_born