使用perf stat时硬件性能计数器会降低吗?

时间:2015-03-21 19:46:58

标签: linux performance perf

我使用命令对perf stat采取基于时间的测量:

$ perf stat -x, -I 100  -oout.txt -e cache-misses:u find / -name file

采集的样本并不总是增加。有些措施低于前一个措施。这是一个例子:

0.100225621,1103127,cache-misses:u
0.200583165,1098697,cache-misses:u
0.300825858,1093229,cache-misses:u
0.401061818,1307353,cache-misses:u
0.501293039,1271823,cache-misses:u
0.601531048,968170,cache-misses:u
0.701913069,986001,cache-misses:u
0.802181430,1080398,cache-misses:u
0.902453753,1312237,cache-misses:u
1.002721050,1276197,cache-misses:u
1.102988175,1263220,cache-misses:u
1.203292647,1201003,cache-misses:u
1.228879941,275942,cache-misses:u

第一项措施是1103127,第二项措施是1098697,低于前一项措施。

这是一个性能缺陷还是有任何解释?

1 个答案:

答案 0 :(得分:5)

无法从你的帖子中看到这是一个-l100(爱情为l)还是-I100(我为间隔)。我认为它是后者。如果是这种情况,那么从手册页开始,它会打印出计数增量

 
-I msecs, --interval-print msecs
           Print count deltas every N milliseconds (minimum: 100ms) example:
           perf stat -I 1000 -e cycles -a sleep 5