运行`perf trace -s`时`perf stat`(和`time`!)显示的结果不正确吗?

时间:2019-05-02 15:46:59

标签: linux performance perf

我正在运行kernel-5.0.9-200.fc29.x86_64(以及具有相同版本号的perf软件包)。

在下面的命令中,报告的msec task-clock远远大于seconds userseconds sys的总数。

这些是真实数字吗,还是限制或错误的结果?

如果它们都是真实的数字,那么task-clock是什么意思?不是CPU时间(user + sys)。另外,我想知道为什么下面的第二个命令花费的实时时间要少10秒钟,而CPU时间却要长 50秒钟:-)。

编辑:在最初的几秒钟内,第一个命令以红色显示很多消息:LOST 5 events!

$ sudo time perf stat perf trace -s dnf -y --releasever=30 --installroot=$HOME/nspawn/fedora-30 --disablerepo='*' --enablerepo=fedora --enablerepo=updates install systemd passwd dnf fedora-release vim-minimal

...

         91,686.29 msec task-clock                #    0.463 CPUs utilized          
           535,179      context-switches          #    0.006 M/sec                  
             5,244      cpu-migrations            #    0.057 K/sec                  
           399,484      page-faults               #    0.004 M/sec                  
   238,663,625,948      cycles                    #    2.603 GHz                    
   348,081,456,496      instructions              #    1.46  insn per cycle         
    51,406,362,901      branches                  #  560.677 M/sec                  
     1,207,307,303      branch-misses             #    2.35% of all branches        

     198.215217338 seconds time elapsed

       5.570430000 seconds user
      11.160145000 seconds sys


5.59user 11.36system 3:18.45elapsed 8%CPU (0avgtext+0avgdata 28212maxresident)k
2760inputs+0outputs (16major+6641minor)pagefaults 0swaps

比较:

$ sudo time perf stat dnf -y --releasever=30 --installroot=/home/alan-sysop/nspawn/fedora-30 --disablerepo=* --enablerepo=fedora --enablerepo=updates install systemd passwd dnf fedora-release vim-minimal

...

         69,277.16 msec task-clock                #    0.371 CPUs utilized          
            22,223      context-switches          #    0.321 K/sec                  
               858      cpu-migrations            #    0.012 K/sec                  
           380,117      page-faults               #    0.005 M/sec                  
   187,946,998,307      cycles                    #    2.713 GHz                    
   312,329,248,251      instructions              #    1.66  insn per cycle         
    44,516,425,061      branches                  #  642.584 M/sec                  
     1,020,032,328      branch-misses             #    2.29% of all branches        

     186.623370416 seconds time elapsed

      62.278802000 seconds user
       6.379658000 seconds sys


62.31user 6.57system 3:06.86elapsed 36%CPU (0avgtext+0avgdata 423700maxresident)k
0inputs+2562096outputs (23major+379286minor)pagefaults 0swaps

1 个答案:

答案 0 :(得分:2)

没有实际的矛盾。

seconds user / seconds sys仅显示直接子项(进程中的所有线程)的rusage统计信息,默认情况下为 inherit 到所有子孙进程。

也就是说,更低的CPU时间仅与perf trace实用程序有关,而更长的时间包括实际的dnf进程。

您还可以通过运行来确认

perf stat --no-inherit perf trace ...

您不能在资源使用摘要中包括孙子代。

P.S。您不应该假定资源使用摘要的行为对于不同的perf版本保持不变。