Question

我很好奇如何解决这个问题。我有这样的数据框：

然后输出有一个基于“a”和“b”值的额外列：

if（a == 1＆amp; b == 1）c = 1，if（a == 1＆amp; b == 0）c = 2，if（a == 0＆amp; b == 1）c = 3 ，否则c = 4.

a    b    c
1    0    2
1    0    2
0    1    3
1    1    1
0    0    4
1    0    2

有什么想法？我不用嵌套的if-else写一个for循环，我们怎么去vectorize？谢谢！

Answer 1

interaction就是这样做的：

c(4,2,3,1)[interaction(df)]
#[1] 2 2 3 1 4 2

Answer 2

这也有效：

library(dplyr)
inner_join (df, cbind(expand.grid(0:1, 0:1), c=c(4, 2, 3, 1)), 
                by=c('a'='Var1', 'b'='Var2'))

  a b c
1 1 0 2
2 1 0 2
3 0 1 3
4 1 1 1
5 0 0 4
6 1 0 2

Answer 3

用一点线性代数：

我们需要从等式c = 4 - x a - y b求解x，y 我们可以看到x = 2，y = 1是给定变量值集合的解决方案

或者我们可以使用limSolve来解决这个过度确定的方程组：

library(limSolve)
res <- Solve(as.matrix(expand.grid(0:1, 0:1)), 4-c(4, 2, 3, 1))
res
Var1 Var2  # a = Var1, b = Var2
   2    1

因此，我们有：

df$c <- 4 - res[1]*df$a - res[2]*df$b
df
a b c
1 1 0 2
2 1 0 2
3 0 1 3
4 1 1 1
5 0 0 4
6 1 0 2

Answer 4

将您想要的c值映射到向量，并使用a和b值作为索引（对于基于1的索引，递增1）。

foo <- data.frame(a=c(1,1,0,1,0,1), b=c(0,0,1,1,0,0))

data.frame(foo, c=c(4:1)[foo$a*2 + foo$b + 1])

#   a b c
# 1 1 0 2
# 2 1 0 2
# 3 0 1 3
# 4 1 1 1
# 5 0 0 4
# 6 1 0 2

根据其他列数据框r中的值添加列

4 个答案: