我有一些数据,每个数据有四列,我想保留基于前3列的唯一行,并保留它们各自的第四列最大值。
我的数据看起来如下所示:
chr1 5 10 1.5
chr1 5 10 0.1
chr3 7 15 5
chr3 7 15 2
chr8 10 20 3
你能帮助我实现这个目标吗?我需要输出如下所示:
chr1 5 10 1.5
chr3 7 15 5
chr8 10 20 3
答案 0 :(得分:0)
仅使用sort
足够简单。
sort -k1,3 -u -t' ' input.txt
-k
根据第1列到第3列进行排序
-u
对于uniq
-t
用于分隔符