汇总文件中的行

时间:2015-04-11 05:18:15

标签: arrays shell unix awk sed

我想基于一个列字段添加行。是否可以通过awk命令或任何简单的方式来做?

Date    Hour  Requests   Success  Error
10-Apr  11      1           1       0
10-Apr  13      1           1       0
10-Apr  14      1           1       0
10-Apr  18      1           1       0
10-Apr  9       1           1       0
10-Apr  11      1           1       0
10-Apr  12      3           3       0
10-Apr  13      2           1       1
10-Apr  14      2           2       0
10-Apr  15      1           1       0
10-Apr  16      1           1       0
10-Apr  12      3           3       0
10-Apr  13      4           1       3
10-Apr  14      1           1       0
10-Apr  16      2           2       0
10-Apr  18      1           1       0
10-Apr  10      3           3       0
10-Apr  11      1           1       0
10-Apr  12      3           3       0
10-Apr  13      1           1       0
10-Apr  14      2           2       0
10-Apr  15      2           2       0
10-Apr  16      2           2       0
10-Apr  17      2           2       0

从上表中我想根据小时添加行(请求,成功,该小时的错误),o / p应该如下所示

Date   Hour  Requests Success Error
10-Apr  9       1       1       0
10-Apr  10      3       3       0
10-Apr  11      3       3       0
10-Apr  12      9       9       0
10-Apr  13      8       4       4
10-Apr  14      6       6       0
10-Apr  15      3       3       0
10-Apr  16      5       5       0
10-Apr  17      2       2       0
10-Apr  18      2       2       0

1 个答案:

答案 0 :(得分:3)

将GNU awk用于真正的Multi-D数组并对in进行排序:

$ cat tst.awk
NR==1 { print; next }
!seen[$1]++ { dates[++numDates] = $1 }
{ for (i=3;i<=NF;i++) sum[$1][$2][i] += $i }
END {
    PROCINFO["sorted_in"] = "@ind_num_asc"
    for (dateNr=1; dateNr<=numDates; dateNr++) {
        date = dates[dateNr]
        for (hr in sum[date]) {
            printf "%s %s ", date, hr
            for (i=3;i<=NF;i++) {
                printf "%s%s", sum[date][hr][i], (i<NF?OFS:ORS)
            }
        }
    }
}
$ awk -f tst.awk file | column -t
Date    Hour  Requests  Success  Error
10-Apr  9     1         1        0
10-Apr  10    3         3        0
10-Apr  11    3         3        0
10-Apr  12    9         9        0
10-Apr  13    8         4        4
10-Apr  14    6         6        0
10-Apr  15    3         3        0
10-Apr  16    5         5        0
10-Apr  17    2         2        0
10-Apr  18    2         2        0

我不确定你的字段是空格还是制表符分隔,所以不要试图在awk中格式化输出。