将printf重定向到awk中的文件

时间:2015-08-06 16:45:59

标签: linux bash awk

我有一个简单的bash脚本。

它的目的是监视http访问日志文件(test.log)并将更新的命中率输出到文件(out.log):

  stdbuf -o0 tail -f test.log | awk -F'[ "]+' '{
  ipcount[$1]++;
  print "test" > "out.log"; #Truncate out.log
  for (i in ipcount) {
        printf "%15s - %d\n", i, ipcount[i] >> "out.log";
        printf "%15s - %d\n", i, ipcount[i] }
}'

主要逻辑有效。我唯一的问题是重定向到“out.log”似乎不起作用。 最后一个printf将预期结果输出到标准输出。 但另外两个printf没有输出任何东西到“out.log”,我无法弄清楚为什么。 out.log拥有所有权限(777)

1 个答案:

答案 0 :(得分:8)

这应该适合你:

tail -f test.log | awk -F'[ "]+' -v out_file="out.log" '{
    val_count[$1]++
    print "" > out_file

    for (i in val_count) {
        printf "%15s - %d\n", i, val_count[i] >> out_file
        printf "%15s - %d\n", i, val_count[i]
    }

    close(out_file)
}'

(注意:我将输出文件定义移动到命令行以希望减少重复。)

您的原始版本存在一个致命问题:print "" > "out.log"仅截断out.log 第一次时间。所有后续调用都只会附加到它,因为它已经打开。作为次要问题,awk喜欢缓冲输出,因此内容只会间歇性地刷新。

要解决此问题,我们需要在每次迭代后close文件。这有力地将输出刷新到out.log并强制>重定向在下一次迭代时重新截断文件。如果您不需要截断每次迭代,那么简单的fflush(out_file)就足够了。

更清楚地说明问题......

这导致output.txt具有多个行,因为它只被截断一次(第一次迭代):

ls -l | awk '{ print "This file has many lines" > "output.txt"; }'

这导致output.txt带有单个输出行,因为它被多次截断:

ls -l | awk '{ print "This file has one line" > "output.txt"; close("output.txt"); }'