我有这个示例数据框,其中列a到d是引用列,列x1-3
需要使用新值进行解析和插入。
以下是重新生成数据框的代码:
df1 <- data_frame(a = c(0,1,0,1), b = c(0,0,1,1), c = c(0,0,0,0), d =
c(1,0,0,1), x1= c(NA, NA, NA, NA), x2= c(NA, NA, NA, NA), x3= c(NA, NA, NA, NA))
我想根据列x1 -x3
中的不同值组合为a, b, c, d
提供新值。我的伪代码如下:
for df1[ , "x1"]:
if a = 1: then return 1
else: return 0
for df1[ , "x2"]:
if a = 1 & b = 1: then return 1
else: return 0
for df1[ , "x3"]:
all conditions: return 1
理想情况下,x1
和x2
中的所有值都会根据其给定条件进行更改。 X3
无论如何都应该填充1
。任何人都可以建议一个有效的循环和方式请解析这些专栏吗?
答案 0 :(得分:1)
你不需要循环:
df1$x1 <- df1$a
df1$x2 <- as.integer(df1$a & df1$b)
df1$x3 <- 1
结果:
a b c d x1 x2 x3
1 0 0 0 1 0 0 1
2 1 0 0 0 1 0 1
3 0 1 0 0 0 0 1
4 1 1 0 1 1 1 1
修改强> 的
如果列a-d不是二进制值(0或1),您仍然可以使用相同的表达式来创建列x1-3。我们假设你有这个数据框:
a b c d x1 x2 x3
1 0 0 1 5 NA NA NA
2 3 9 2 1 NA NA NA
3 4 2 3 5 NA NA NA
4 2 1 4 1 NA NA NA
你的条件是:
x1 = 1 if (b >= 2) and (d < 4) 0 otherwise
x2 = 1 if (a > b) and (b < d) 0 otherwise
x3 = always 1
您可以使用相同的方法:
df1$x1 <- as.integer(df1$b >= 2 & df1$d < 4)
df1$x2 <- as.integer(df1$a > df1$b & df1$b < df1$d)
df1$x3 <- 1
结果:
a b c d x1 x2 x3
1 0 0 1 5 0 0 1
2 3 9 2 1 1 0 1
3 4 2 3 5 0 1 1
4 2 1 4 1 0 0 1