Question

数据清理和聚合后，我得到了一个数据表，如下所示：

df
id d1        v1  d2        v2  d3        v3  d4        v4
1  1-1-2018  1   1-1-2018  1   1-1-2018  1   1-1-2018  1
2  1-1-2018  1   1-2-2018  2   1-2-2018  2   1-2-2018  2
3  1-1-2018  1   1-2-2018  2   1-3-2018  3   1-3-2018  3
4  1-1-2018  1   1-2-2018  2   1-3-2018  3   1-4-2018  4

我正在尝试从上述数据框中的某个列中删除与先前列重复的任何值。

我已经尝试过：

df$v2[df$v1 == df$v2] <- NA

这会删除v2列中的所有值

我希望数据框最后看起来像这样：

df
id d1        v1  d2        v2  d3        v3  d4        v4
1  1-1-2018  1   NA        NA  NA        NA  NA        NA
2  1-1-2018  1   1-2-2018  2   NA        NA  NA        NA
3  1-1-2018  1   1-2-2018  2   1-3-2018  3   NA        NA
4  1-1-2018  1   1-2-2018  2   1-3-2018  3   1-4-2018  4

Answer 1

尝试df [...这里的条件...] $列<-不适用

或使用data.table：

library(data.table)
dt <- data.table(df)
dt[d1 == d2, v1 := NA]

删除重复的值

1 个答案: