我的工作是使用perf
测量mutilprocessor计算机中的每个节点(例如4个核心)。包括缓存未命中,LLC负载,LLC负载未命中,LLC存储,LLC存储未命中等等,我只获得总统计数据。
有没有办法区分它们?
答案 0 :(得分:0)
根据您的perf
版本,您可以使用-a
和-C
个开关的组合。
演示机器只有两个CPU,但我们可以限制为CPU 1。
perf stat -B -e cycles:u,instructions:u -a -C 1 sleep 5 Performance counter stats for 'sleep 5': 301,141,166 cycles 225,595,284 instructions # 0.749 IPC 5.002125198 seconds time elapsed
所以,如果你有4个处理器,你可以这样做:
perf stat -B -e cycles:u,instructions:u -a -C 0 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 1 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 2 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 3 sleep 5