如何在引用其他多列的值时解析列?

时间:2017-11-15 20:52:48

标签: r function loops dplyr

我有这个示例数据框,其中列a到d是引用列,列x1-3需要使用新值进行解析和插入。

以下是重新生成数据框的代码:

    df1 <- data_frame(a = c(0,1,0,1), b = c(0,0,1,1), c = c(0,0,0,0), d = 
      c(1,0,0,1), x1= c(NA, NA, NA, NA), x2= c(NA, NA, NA, NA), x3= c(NA, NA, NA, NA))

enter image description here

我想根据列x1 -x3中的不同值组合为a, b, c, d提供新值。我的伪代码如下:

    for df1[ , "x1"]:
        if a = 1: then return 1
        else: return 0
    for df1[ , "x2"]: 
        if a = 1 & b = 1: then return 1
        else: return 0
    for df1[ , "x3"]: 
        all conditions: return 1

理想情况下,x1x2中的所有值都会根据其给定条件进行更改。 X3无论如何都应该填充1。任何人都可以建议一个有效的循环和方式请解析这些专栏吗?

1 个答案:

答案 0 :(得分:1)

你不需要循环:

df1$x1 <- df1$a
df1$x2 <- as.integer(df1$a & df1$b)
df1$x3 <- 1

结果:

  a b c d x1 x2 x3
1 0 0 0 1  0  0  1
2 1 0 0 0  1  0  1
3 0 1 0 0  0  0  1
4 1 1 0 1  1  1  1

修改

如果列a-d不是二进制值(0或1),您仍然可以使用相同的表达式来创建列x1-3。我们假设你有这个数据框:

  a b c d x1 x2 x3
1 0 0 1 5 NA NA NA
2 3 9 2 1 NA NA NA
3 4 2 3 5 NA NA NA
4 2 1 4 1 NA NA NA

你的条件是:

x1 = 1 if (b >= 2) and (d < 4) 0 otherwise
x2 = 1 if (a > b) and (b < d) 0 otherwise
x3 = always 1

您可以使用相同的方法:

df1$x1 <- as.integer(df1$b >= 2 & df1$d < 4)
df1$x2 <- as.integer(df1$a > df1$b & df1$b < df1$d)
df1$x3 <- 1

结果:

  a b c d x1 x2 x3
1 0 0 1 5  0  0  1
2 3 9 2 1  1  0  1
3 4 2 3 5  0  1  1
4 2 1 4 1  0  0  1