删除重复的值

时间:2018-12-28 18:31:16

标签: date duplicates data-cleaning

数据清理和聚合后,我得到了一个数据表,如下所示:

df
id d1        v1  d2        v2  d3        v3  d4        v4
1  1-1-2018  1   1-1-2018  1   1-1-2018  1   1-1-2018  1
2  1-1-2018  1   1-2-2018  2   1-2-2018  2   1-2-2018  2
3  1-1-2018  1   1-2-2018  2   1-3-2018  3   1-3-2018  3
4  1-1-2018  1   1-2-2018  2   1-3-2018  3   1-4-2018  4

我正在尝试从上述数据框中的某个列中删除与先前列重复的任何值。

我已经尝试过:

df$v2[df$v1 == df$v2] <- NA

这会删除v2列中的所有值

我希望数据框最后看起来像这样:

df
id d1        v1  d2        v2  d3        v3  d4        v4
1  1-1-2018  1   NA        NA  NA        NA  NA        NA
2  1-1-2018  1   1-2-2018  2   NA        NA  NA        NA
3  1-1-2018  1   1-2-2018  2   1-3-2018  3   NA        NA
4  1-1-2018  1   1-2-2018  2   1-3-2018  3   1-4-2018  4

1 个答案:

答案 0 :(得分:0)

尝试df [...这里的条件...] $列<-不适用

或使用data.table:

library(data.table)
dt <- data.table(df)
dt[d1 == d2, v1 := NA]