R使用查找表使用查询的列名更新数据帧中的零值

时间:2019-06-11 08:14:49

标签: r

我希望能够使用替换值查找表替换数据框中的零值,其中替换值对于每一列都是不同的。相信下面的简单示例可以说明问题和预期的结果。

# Dummy data frame
A <- seq(0,5,1)
B <- seq(5,0,-1)
C <- c(1,3,0,4,2,5)
dfr<-data.frame(A,B,C)

 A B C
 0 5 1
 1 4 3
 2 3 0
 3 2 4
 4 1 2
 5 0 5

# Lookup table with replacement values
D <- c('A','B','C')
E <- c(0.5,0.04,0.003)
lku <- data.frame(D,E)

D     E
A 0.500
B 0.040
C 0.003

# Desired answer
 A    B    C
 0.50 5.00 1.000
 1.00 4.00 3.000
 2.00 3.00 0.003
 3.00 2.00 4.000
 4.00 1.00 2.000
 5.00 0.04 5.000

因此,如果使用查找表在A列中找到零,则该零将被替换为0.50,但是对于B列,该零将被替换为0.04,依此类推。除了在循环中逐一遍历各列并指向查找表的相应行之外,我不确定从何处开始?

更新

我尝试了循环解决方案,使它无法正常工作-解释为什么不起作用的原因。

for(i in 1:3){
  ifelse(dfr[ ,i] == 0, lku[i,2], dfr[ ,i])
}

3 个答案:

答案 0 :(得分:2)

使用Map

的基本R选项
dfr[] <- Map(function(x, y) replace(x, x == 0, y), dfr, 
                            lku$E[match(names(dfr), lku$D)])

#    A    B     C
#1 0.5 5.00 1.000
#2 1.0 4.00 3.000
#3 2.0 3.00 0.003
#4 3.0 2.00 4.000
#5 4.0 1.00 2.000
#6 5.0 0.04 5.000

答案 1 :(得分:1)

另一种base R可能是:

sweep(dfr == 0, 2, t(lku[2]), "*") + dfr

    A    B     C
1 0.5 5.00 1.000
2 1.0 4.00 3.000
3 2.0 3.00 0.003
4 3.0 2.00 4.000
5 4.0 1.00 2.000
6 5.0 0.04 5.000

答案 2 :(得分:1)

带有base R

的选项
lku$E[col(dfr)] * (!dfr) + dfr
#   A    B     C
#1 0.5 5.00 1.000
#2 1.0 4.00 3.000
#3 2.0 3.00 0.003
#4 3.0 2.00 4.000
#5 4.0 1.00 2.000
#6 5.0 0.04 5.000