为什么perf -e cpu-cycles在多次运行中报告不同的答案?

时间:2016-07-31 17:04:51

标签: c++ linux g++ perf

在此示例代码中:

#include <iostream>
using namespace std;

int main()
{
    cout<<"Hello World!"<<endl;

    return 0;
}

我运行了以下命令3次:

perf stat -e cpu-cycles ./sample

以下是连续执行的3个输出:

1)

Hello World!

Performance counter stats for './try':

     22,71,970      cpu-cycles               

   0.003634105 seconds time elapsed

2)

Hello World!

 Performance counter stats for './try':

     18,51,044      cpu-cycles               

   0.001045616 seconds time elapsed

3)

Hello World!

 Performance counter stats for './try':

     18,21,834      cpu-cycles               

   0.001153489 seconds time elapsed

为什么同一个程序在多次运行中会占用不同数量的cpu-cycle?

我正在使用“Intel(R)Core(TM)i5-5250U CPU @ 1.60GHz”,“Ubuntu 14.04.3 LTS”和“g ++ 4.8.4”。

1 个答案:

答案 0 :(得分:1)

在程序启动期间,二进制代码是内存映射的,但是懒得加载(根据需要)。因此,在程序的第一次调用期间,内核花费一些CPU周期(透明地)加载二进制代码,因为执行命中了尚未在RAM中的指令页。后续调用因重用缓存代码所花费的时间较少,除非底层文件已更改或程序已执行很长时间并且其页面已被回收。