有人可以解释重新格式化awk()|输出的最佳方法排序| uniq -c | sort -rg?

时间:2015-03-29 12:14:16

标签: linux sorting awk printf uniq

我制作了一个用于分析Windows日志消息号的脚本。 uniq -c数字的输出很难预测,因为根据数字的大小存在不同的空白区域。此时我手动删除了空格。

这是对消息进行排序和计数的命令:

cat nt2.rawlog | awk 'BEGIN {FS=","} {print $3,$4,$6,$7}' | sort | uniq -c | sort -rg >> ~/tempNT2.report

这是我对示例输出的最佳尝试:

21340  4624,Windows-Security-Audit-Log,Success Audit,Logon
 1209  4658,Windows-Security-Audit-Log,Success Audit,Privileged Logon

我想要的输出是:

[tab]21340[tab]--[tab]Security Audit Log 4624 (Logon Success Audit)
[tab]1209[tab]--[tab]Security Audit Log 4658 (Privileged Logon Success Audit)

1 个答案:

答案 0 :(得分:1)

这样的东西
awk -F , '{ i = split($1, n, / +/);
  printf ("\t%d\t--\t%s %d (%s %s)\n", n[i-1], $2, n[i], substr($4, 2), $3) }'

字段分隔符,执行第一级分割;然后我们在空白处拆分第一个字段,并将数字提取到nn中的元素数量取决于字段是否具有前导空格,因此我们计算结尾的最后两个字段。最后一个字段有一个讨厌的前导空格,所以我们从该字段的第二个字符中提取一个子字符串。