带有制表符分隔分隔符的 .txt 文件,有4列,其中没有行,每行都有以下形式:
12345 a xxx yyy
12345 b xxx yyy
67890 c xxx yyy
12345 d xxx zzz
67890 e xxx zzz
12345 f xxx zzz
23456 g xxx zzz
如何计算 .txt 文件中整个第一列中每个唯一整数的实例,并通过将第五列附加到将计数添加为每行中的第五个值。 txt 文件。
12345 a xxx yyy 1
12345 b xxx yyy 2
67890 c xxx yyy 1
12345 d xxx zzz 3
67890 e xxx zzz 2
12345 f xxx zzz 4
23456 g xxx zzz 1
我更喜欢仅使用UNIX命令行流处理程序的解决方案。非常感谢任何帮助。谢谢。
答案 0 :(得分:3)
使用awk
的一种方式:
awk '
BEGIN { OFS = "\t"; }
{
key[ $1 ]++;
print $0, key[ $1 ];
}
' infile
输出:
12345 a xxx yyy 1
12345 b xxx yyy 2
67890 c xxx yyy 1
12345 d xxx zzz 3
67890 e xxx zzz 2
12345 f xxx zzz 4
23456 g xxx zzz 1