unix命令用于计算其中一列中的值,并将此值添加到每行的最后一列

时间:2012-08-18 18:16:40

标签: unix sed awk

带有制表符分隔分隔符的 .txt 文件,有4列,其中没有行,每行都有以下形式:

12345  a  xxx   yyy  
12345  b  xxx   yyy     
67890  c  xxx   yyy  
12345  d  xxx   zzz   
67890  e  xxx   zzz  
12345  f  xxx   zzz  
23456  g  xxx   zzz   

如何计算 .txt 文件中整个第一列中每个唯一整数的实例,并通过将第五列附加到将计数添加为每行中的第五个值。 txt 文件。

12345  a  xxx   yyy  1  
12345  b  xxx   yyy  2     
67890  c  xxx   yyy  1   
12345  d  xxx   zzz  3   
67890  e  xxx   zzz  2  
12345  f  xxx   zzz  4  
23456  g  xxx   zzz  1 

我更喜欢仅使用UNIX命令行流处理程序的解决方案。非常感谢任何帮助。谢谢。

1 个答案:

答案 0 :(得分:3)

使用awk的一种方式:

awk '
    BEGIN { OFS = "\t"; }
    { 
        key[ $1 ]++;
        print $0, key[ $1 ];
    }
' infile

输出:

12345  a  xxx   yyy     1
12345  b  xxx   yyy     2
67890  c  xxx   yyy     1
12345  d  xxx   zzz     3
67890  e  xxx   zzz     2
12345  f  xxx   zzz     4
23456  g  xxx   zzz     1