英特尔Broadwell-EP中MEM_LOAD_UOPS_RETIRED.L3_MISS事件的分解

时间:2018-02-05 00:58:06

标签: performance x86 cpu-architecture micro-optimization

我正在尝试比较应用程序的一致性和DRAM访问成本。

为此,我正在考虑测量L3_MISS(特别是MEM_LOAD_UOPS_RETIRED.L3_MISS)事件并将其与HITM事件(特别是MEM_LOAD_UOPS_L3_HIT_RETIRED.XSNP_HITMMEM_LOAD_UOPS_L3_MISS_RETIRED.REMOTE_HITM)进行比较。

在perfmon页面(link)中查看L3_MISS事件的描述时,我发现了以下描述:

  

错过最后一级(L3)缓存。排除未知数据源。

根据这个定义,我有三个问题:

  1. 以上描述是否意味着L3_MISS事件计数不包括跨套接字HITM事件(因为源未知)?我在英特尔SDM和2016优化参考中找不到更详细的描述。
  2. 进一步推测,这是否意味着L3_MISS的所有子组件 - {LOCAL_DRAM,REMOTE_DRAM,REMOTE_FWD}也不包含在L3_MISS计数中?
  3. 或者我错过了英特尔SDM中未知数据源的某些定义?
  4. 提前致谢!

    PS:系统信息 - Broadwell E5 2660v4,使用PAPI获取性能计数器数

0 个答案:

没有答案