删除多列上的重复保持最新

时间:2017-05-22 19:52:41

标签: python r date duplicates

我想使用R和/或Python得到以下结果:

如果CoordinateXCoordinateYName相同,请保留最新的Date

My Data

我在python中遇到了一些问题。

1 个答案:

答案 0 :(得分:0)

在R中,使用dplyr

data %>% 
    group_by(Name, CoordinateX, CoordinateY) %>% 
    arrange(desc(Date)) %>% 
    distinct() %>% 
    ungroup()

提供输出:

Name       Date CoordinateX CoordinateY
Aaa  2018-08-29      650000      134999
Bbb  2010-08-29      650000      134999
Bbb  2010-08-29      655600      134999
Ccc  2010-08-29      655600      134999