计算Linux中几个“时间”命令的平均值

时间:2013-07-11 19:13:38

标签: linux language-agnostic statistics profiling benchmarking

我正在使用“time”命令在Linux上分析程序。问题是它的输出在统计上不是很相关,因为它只运行一次程序。是否有工具或方法可以获得平均几次“时间”运行?可能还有偏差等统计信息?

4 个答案:

答案 0 :(得分:6)

这是我编写的一个脚本,用于执行与您要查找的内容类似的操作。它运行提供的命令10次,将实际的用户CPU和系统CPU时间记录到文件中,并在每次命令输出后回显tham。然后使用awk提供文件中3列中每一列的平均值,但不包括标准偏差。

#!/bin/bash

rm -f /tmp/mtime.$$

for x in {1..10}
do
  /usr/bin/time -f "real %e user %U sys %S" -a -o /tmp/mtime.$$ $@
  tail -1 /tmp/mtime.$$
done

awk '{ et += $2; ut += $4; st += $6; count++ } END {  printf "Average:\nreal %.3f user %.3f sys %.3f\n", et/count, ut/count, st/count }' /tmp/mtime.$$

答案 1 :(得分:0)

与上面提到的评论者一样,听起来您可能希望使用循环多次运行程序,以获得更多数据点。您可以使用带有-o选项的time命令将time命令的结果输出到文本文件,如下所示: time -o output.txt myprog

答案 2 :(得分:0)

使用hyperfine

例如:

hyperfine 'sleep 0.3'

将多次运行命令 sleep 0.3,然后输出如下内容:

hyperfine 'sleep 0.3'
Benchmark #1: sleep 0.3
  Time (mean ± σ):     306.7 ms ±   3.0 ms    [User: 2.8 ms, System: 3.5 ms]
  Range (min … max):   301.0 ms … 310.9 ms    10 runs

答案 3 :(得分:0)

perf stat 使用 -r (-repeat=<n>) 选项为您执行此操作,包括平均值和方差。

例如在 awk 中使用一个短循环来模拟一些工作,足够短以至于 CPU 频率上升和其他启动开销可能是一个因素(Idiomatic way of performance evaluation?),尽管我的 CPU 似乎上升到了 3.9GHz快速,平均 3.82 GHz。

$ perf stat -r5 awk 'BEGIN{for(i=0;i<1000000;i++){}}'

 Performance counter stats for 'awk BEGIN{for(i=0;i<1000000;i++){}}' (5 runs):

             37.90 msec task-clock                #    0.968 CPUs utilized            ( +-  2.18% )
                 1      context-switches          #   31.662 /sec                     ( +-100.00% )
                 0      cpu-migrations            #    0.000 /sec                   
               181      page-faults               #    4.776 K/sec                    ( +-  0.39% )
       144,802,875      cycles                    #    3.821 GHz                      ( +-  0.23% )
       343,697,186      instructions              #    2.37  insn per cycle           ( +-  0.05% )
        93,854,279      branches                  #    2.476 G/sec                    ( +-  0.04% )
            29,245      branch-misses             #    0.03% of all branches          ( +- 12.79% )

           0.03917 +- 0.00182 seconds time elapsed  ( +-  4.63% )

(向右滚动查看差异。)

如果您有一个单线程任务并希望最小化上下文切换,您可以使用 taskset -c3 perf stat ... 将任务固定到特定核心(在这种情况下为 #3)。

默认情况下,perf stat 使用硬件性能计数器来分析指令、核心时钟周期(与现代 CPU 上的时间不同)和分支未命中等内容。这具有相当低的开销,尤其是计数器处于“计数”模式而不是 perf record 会导致中断对事件热点进行统计采样。

您可以使用 -e task-clock 仅使用该事件,而无需使用硬件性能计数器。 (或者,如果您的系统在 VM 中,或者您没有更改默认的 /proc/sys/kernel/perf_event_paranoid,则 perf 可能无法要求内核进行任何编程。)

有关 perf 的更多信息,请参阅


对于打印输出的程序,它看起来像这样:

$ perf stat -r5 echo hello
hello
hello
hello
hello
hello

 Performance counter stats for 'echo hello' (5 runs):

              0.27 msec task-clock                #    0.302 CPUs utilized            ( +-  4.51% )
...
          0.000890 +- 0.000411 seconds time elapsed  ( +- 46.21% )

对于单次运行(默认没有 -r),perf stat 将显示经过的时间,以及 user / sys.但出于某种原因,-r 并没有对这些进行平均。