我有以下数据集:
A_1 <- c(2, 3, 3, 2, 4)
A_2 <- c(5, 5, 6, 4, 4)
A_3 <- c(9, 9, 8, 7, 6)
B_1 <- c(1, 0, 0, 0, 0)
B_2 <- c(1, 1, 1, 0, 0)
B_3 <- c(0, 0, 0, 1, 1)
df <- cbind(A_1, A_2, A_3, B_1, B_2, B_3)
> df
A_1 A_2 A_3 B_1 B_2 B_3
[1,] 2 5 9 1 1 0
[2,] 3 5 9 0 1 0
[3,] 3 6 8 0 1 0
[4,] 2 4 7 0 0 1
[5,] 4 4 6 0 0 1
我想将A_1中的值替换为B_1 == 1的行中的NAs,我想将A_2中的值替换为B_2 == 1的行中的NA,并且我想替换值中的值A_3,行中的NAs,其中B_3 == 1.最终数据集应如下所示:
> df
A_1 A_2 A_3 B_1 B_2 B_3
[1,] NA NA 9 1 1 0
[2,] 3 NA 9 0 1 0
[3,] 3 NA 8 0 1 0
[4,] 2 4 NA 0 0 1
[5,] 4 4 NA 0 0 1
对大型数据集执行此操作的最有效方法是什么?谢谢!
答案 0 :(得分:2)
这样的事情怎么样......
df[,1:3][df[,4:6]==1] <- NA
df
A_1 A_2 A_3 B_1 B_2 B_3
[1,] NA NA 9 1 1 0
[2,] 3 NA 9 0 1 0
[3,] 3 NA 8 0 1 0
[4,] 2 4 NA 0 0 1
[5,] 4 4 NA 0 0 1