我希望能够使用替换值查找表替换数据框中的零值,其中替换值对于每一列都是不同的。相信下面的简单示例可以说明问题和预期的结果。
# Dummy data frame
A <- seq(0,5,1)
B <- seq(5,0,-1)
C <- c(1,3,0,4,2,5)
dfr<-data.frame(A,B,C)
A B C
0 5 1
1 4 3
2 3 0
3 2 4
4 1 2
5 0 5
# Lookup table with replacement values
D <- c('A','B','C')
E <- c(0.5,0.04,0.003)
lku <- data.frame(D,E)
D E
A 0.500
B 0.040
C 0.003
# Desired answer
A B C
0.50 5.00 1.000
1.00 4.00 3.000
2.00 3.00 0.003
3.00 2.00 4.000
4.00 1.00 2.000
5.00 0.04 5.000
因此,如果使用查找表在A列中找到零,则该零将被替换为0.50,但是对于B列,该零将被替换为0.04,依此类推。除了在循环中逐一遍历各列并指向查找表的相应行之外,我不确定从何处开始?
更新
我尝试了循环解决方案,使它无法正常工作-解释为什么不起作用的原因。
for(i in 1:3){
ifelse(dfr[ ,i] == 0, lku[i,2], dfr[ ,i])
}
答案 0 :(得分:2)
使用Map
dfr[] <- Map(function(x, y) replace(x, x == 0, y), dfr,
lku$E[match(names(dfr), lku$D)])
# A B C
#1 0.5 5.00 1.000
#2 1.0 4.00 3.000
#3 2.0 3.00 0.003
#4 3.0 2.00 4.000
#5 4.0 1.00 2.000
#6 5.0 0.04 5.000
答案 1 :(得分:1)
另一种base R
可能是:
sweep(dfr == 0, 2, t(lku[2]), "*") + dfr
A B C
1 0.5 5.00 1.000
2 1.0 4.00 3.000
3 2.0 3.00 0.003
4 3.0 2.00 4.000
5 4.0 1.00 2.000
6 5.0 0.04 5.000
答案 2 :(得分:1)
带有base R
lku$E[col(dfr)] * (!dfr) + dfr
# A B C
#1 0.5 5.00 1.000
#2 1.0 4.00 3.000
#3 2.0 3.00 0.003
#4 3.0 2.00 4.000
#5 4.0 1.00 2.000
#6 5.0 0.04 5.000