我想根据特定ID的给定变量值将NA
转换为特定值。示例查询:df1 ---> DF2
df1 = data.frame(ID=c(1,1, 1, 1, 2,2,2,2,3,3,3,3),WHR=c(0.8,NA, NA, NA,1.0, NA, NA,NA,1.1, NA, NA, NA))
df2=data.frame(ID=c(1,1, 1, 1, 2,2,2,2,3,3,3,3),WHR=c(0.8,0.8, 0.8, 0.8,1.0, 1.0,1.0,1.0, 1.1, 1.1,1.1,1.1))`
我尝试了什么
R fill in NA with previous row value with condition:
library(xts)
df1[,WHR:=na.locf("WHR", fromlast=TRUE, by = ID)`
收到错误:
could not find function ":=";
我使用了这段代码,因为我有数百个ID值,我想要一个基于ID在特定列中更改NA
的自动代码。
如何将df1
转换为df2
? (请解释一下你的代码,这样可以帮助其他初学者用户)。谢谢!
答案 0 :(得分:1)
使用基数R,您可以使用其位置的cumsum和ave
函数广播第一个非NA:
df2$WHR.Comp = ave(df1$WHR, cumsum(!is.na(df1$WHR)), FUN=function(x) x[1])
> df2
ID WHR WHR.Comp
1 1 0.8 0.8
2 1 0.8 0.8
3 1 0.8 0.8
4 1 0.8 0.8
5 2 1.0 1.0
6 2 1.0 1.0
7 2 1.0 1.0
8 2 1.0 1.0
9 3 1.1 1.1
10 3 1.1 1.1
11 3 1.1 1.1
12 3 1.1 1.1
答案 1 :(得分:0)
您可以为缺失值构建映射:
idx <- !is.na(df1[,"WHR"])
map <- setNames(df1[idx,"WHR"], df1[idx,"ID"])
然后将此地图应用于NA
值
df2[!idx, "WHR2"] <- map[df2[!idx, "ID"]]
答案 2 :(得分:0)
表示ID:
for (i in unique(df1$ID)) df1[df1$ID==i & is.na(df1[,'WHR']),'WHR'] <- mean(df2[df2$ID==i,'WHR'])