开源分析器用于分析低级架构的低效率?

时间:2009-04-06 07:38:21

标签: performance caching profiler

现代处理器使用各种技巧来弥合其处理元件的大速度与外部存储器的延迟之间的差距。在性能关键型应用程序中,构建代码的方式通常会对其效率产生相当大的影响。例如,使用SLO分析仪的研究人员能够修复缓存局部性问题,并将几个SPEC2000基准程序的执行速度提高一倍。我正在寻找一个开源工具的建议,该工具利用处理器的性能监控支持来定位和分析架构效率低下,例如缓存未命中,分支错误预测,前端停顿,通过地址混叠的缓存污染,长延迟指令和TLB未命中。我知道英特尔的VTune(商业),AMD的CodeAnalysist(免费但非开源)和Cachegrind(依赖于模拟)。

1 个答案:

答案 0 :(得分:1)

对于Linux,oprofile效果很好。实际上,AMD的CodeAnalysist使用oprofile作为后端。

Oprofile使用处理器的内部性能调整机制来分析架构无效率。