Linux命令用于保存最新数据并删除csv文件中的其他重复项

时间:2014-11-07 09:44:12

标签: linux

我有一个基于时间戳排序的csv文件。如下所示:

DCR_Path,翻译方向,日期和时间时间

data1,Send for Translation to CTM,Sep 30 2014 03:22

data2,Send for Translation to CTM,Sep 30 2014 03:21

data1,发送给CTM翻译,2014年9月30日03:12

data3,Send for Translation to CTM,Sep 30 2014 03:10

data2,Send for Translation to CTM,Sep 30 2014 02:22

data1,Send for Translation to CTM,Sep 30 2014 02:20


我需要采取最新的并删除其他副本,输出应该是:

DCR_Path,翻译方向,日期和时间时间

data1,Send for Translation to CTM,Sep 30 2014 03:22

data2,Send for Translation to CTM,Sep 30 2014 03:21

data3,Send for Translation to CTM,Sep 30 2014 03:10


我尝试了一些排序命令,但无法获得结果。我怎样才能实现所需的输出?

1 个答案:

答案 0 :(得分:1)

尝试:

sort -u -t, -k1,2 test.txt
  • -u将获得独特的记录
  • -t,使用逗号作为分隔符来分隔字段
  • -k1,2选择字段1和2进行比较并选择uniq