Perfmon - 每个线程的L2缓存未命中

时间:2012-11-16 21:00:15

标签: scheduling x86-64 perfmon

Architecture:
**AMD** Opteron quad-core using 2 CPUs --- Numa system
Each CPU has a shared L3 Cache ; Each Core has a private L1 and L2

Processor : x86_64 Operating System: GNU/Linux

我是Perfmon的新世界。我想获得像Last level cache misses(LLCM)IPS这样的效果计数器。

当只有一个线程/核心时,我能够获取它们

当有超过2 threads/core时,是否也可以获取每个线程的IPS和LLCM等性能计数器。

从我的研究中 - 我意识到,当有多个thread/core时,由于AMD没有提供这些性能计数器,因此不可能在每个线程上获得LLCM / IPS。

所以,我的问题是,是否有可能在二级缓存中获取PC /线程。 如果是 - 怎么样?

感谢。

1 个答案:

答案 0 :(得分:1)

我对它进行了一些研究并向我的教授询问了这件事。

看来perfmon确实允许我们这样做。

希望这会有所帮助。如果我能以某种方式提供帮助,请告诉我。