我正在尝试使用perf
对使用C语言编写的代码进行基准测试,并且在前端空闲周期计数中获得超过100%。我已经看到这种情况发生在后端空闲周期计数中。两者都超过100个。每个周期的指令数量相当高 - 范围从5 - 10
。
3,569,966 stalled-cycles-frontend # 111.98% frontend cycles idle
1,843,327 stalled-cycles-backend # 57.82% backend cycles idle
17,875,020 instructions # 5.61 insns per cycle
# 0.20 stalled cycles per insn
百分比如此之高是什么意思?
答案 0 :(得分:0)
这些百分比与活动CPU周期有关,显示为cycles
。因此,cycles
不是总周期,而是活动CPU周期,并且相对于它计算前端或后端停顿周期。