Architecture:
**AMD** Opteron quad-core using 2 CPUs --- Numa system
Each CPU has a shared L3 Cache ; Each Core has a private L1 and L2
Processor : x86_64 Operating System: GNU/Linux
我是Perfmon的新世界。我想获得像Last level cache misses(LLCM)
和IPS
这样的效果计数器。
当只有一个线程/核心时,我能够获取它们
当有超过2 threads/core
时,是否也可以获取每个线程的IPS和LLCM等性能计数器。
从我的研究中 - 我意识到,当有多个thread/core
时,由于AMD没有提供这些性能计数器,因此不可能在每个线程上获得LLCM / IPS。
所以,我的问题是,是否有可能在二级缓存中获取PC /线程。 如果是 - 怎么样?
感谢。
答案 0 :(得分:1)
我对它进行了一些研究并向我的教授询问了这件事。
看来perfmon确实允许我们这样做。
希望这会有所帮助。如果我能以某种方式提供帮助,请告诉我。