awk找到重复出现并汇总特定列

时间:2013-12-26 13:53:53

标签: awk

使用awk从特定列中查找重复出现的字符串的方法是什么?相邻列值的总和? 我的意见:

A B C_1 10
A B D_0 2
A B C_1 2
A B D_2 15
A B D_0 3

output should be
2 C_1 12
2 D_0 5
1 D_2 15

非常感谢。

1 个答案:

答案 0 :(得分:4)

您可以尝试以下代码:

awk '
{
    a[$3]++
    b[$3]+=$4
}

END {
    for (i in a)
        print a[i], i, b[i]
}' file

带输出:

2 D_0 5
2 C_1 12
1 D_2 15