我正在使用“time”命令在Linux上分析程序。问题是它的输出在统计上不是很相关,因为它只运行一次程序。是否有工具或方法可以获得平均几次“时间”运行?可能还有偏差等统计信息?
答案 0 :(得分:6)
这是我编写的一个脚本,用于执行与您要查找的内容类似的操作。它运行提供的命令10次,将实际的用户CPU和系统CPU时间记录到文件中,并在每次命令输出后回显tham。然后使用awk提供文件中3列中每一列的平均值,但不包括标准偏差。
#!/bin/bash
rm -f /tmp/mtime.$$
for x in {1..10}
do
/usr/bin/time -f "real %e user %U sys %S" -a -o /tmp/mtime.$$ $@
tail -1 /tmp/mtime.$$
done
awk '{ et += $2; ut += $4; st += $6; count++ } END { printf "Average:\nreal %.3f user %.3f sys %.3f\n", et/count, ut/count, st/count }' /tmp/mtime.$$
答案 1 :(得分:0)
与上面提到的评论者一样,听起来您可能希望使用循环多次运行程序,以获得更多数据点。您可以使用带有-o选项的time命令将time命令的结果输出到文本文件,如下所示: time -o output.txt myprog
答案 2 :(得分:0)
使用hyperfine。
例如:
hyperfine 'sleep 0.3'
将多次运行命令 sleep 0.3
,然后输出如下内容:
hyperfine 'sleep 0.3'
Benchmark #1: sleep 0.3
Time (mean ± σ): 306.7 ms ± 3.0 ms [User: 2.8 ms, System: 3.5 ms]
Range (min … max): 301.0 ms … 310.9 ms 10 runs
答案 3 :(得分:0)
perf stat
使用 -r
(-repeat=<n>
) 选项为您执行此操作,包括平均值和方差。
例如在 awk
中使用一个短循环来模拟一些工作,足够短以至于 CPU 频率上升和其他启动开销可能是一个因素(Idiomatic way of performance evaluation?),尽管我的 CPU 似乎上升到了 3.9GHz快速,平均 3.82 GHz。
$ perf stat -r5 awk 'BEGIN{for(i=0;i<1000000;i++){}}'
Performance counter stats for 'awk BEGIN{for(i=0;i<1000000;i++){}}' (5 runs):
37.90 msec task-clock # 0.968 CPUs utilized ( +- 2.18% )
1 context-switches # 31.662 /sec ( +-100.00% )
0 cpu-migrations # 0.000 /sec
181 page-faults # 4.776 K/sec ( +- 0.39% )
144,802,875 cycles # 3.821 GHz ( +- 0.23% )
343,697,186 instructions # 2.37 insn per cycle ( +- 0.05% )
93,854,279 branches # 2.476 G/sec ( +- 0.04% )
29,245 branch-misses # 0.03% of all branches ( +- 12.79% )
0.03917 +- 0.00182 seconds time elapsed ( +- 4.63% )
(向右滚动查看差异。)
如果您有一个单线程任务并希望最小化上下文切换,您可以使用 taskset -c3 perf stat ...
将任务固定到特定核心(在这种情况下为 #3)。
默认情况下,perf stat
使用硬件性能计数器来分析指令、核心时钟周期(与现代 CPU 上的时间不同)和分支未命中等内容。这具有相当低的开销,尤其是计数器处于“计数”模式而不是 perf record
会导致中断对事件热点进行统计采样。
您可以使用 -e task-clock
仅使用该事件,而无需使用硬件性能计数器。 (或者,如果您的系统在 VM 中,或者您没有更改默认的 /proc/sys/kernel/perf_event_paranoid
,则 perf 可能无法要求内核进行任何编程。)
有关 perf
的更多信息,请参阅
对于打印输出的程序,它看起来像这样:
$ perf stat -r5 echo hello
hello
hello
hello
hello
hello
Performance counter stats for 'echo hello' (5 runs):
0.27 msec task-clock # 0.302 CPUs utilized ( +- 4.51% )
...
0.000890 +- 0.000411 seconds time elapsed ( +- 46.21% )
对于单次运行(默认没有 -r
),perf stat 将显示经过的时间,以及 user / sys.但出于某种原因,-r
并没有对这些进行平均。