我想在运行一个特定程序时计算L2缓存未命中的总数。是否有任何方法可以在L2缓存中找到缓存未命中?
我知道,Core i7 CPU的性能计数器事件类型“L2_LINES_OUT”可用于Counts L2缓存线被驱逐,但不知道如何使用它?
我正在使用linux和Intel i7 IvyBridge机器。
任何指针或链接都将受到高度赞赏。
答案 0 :(得分:2)
根据this summary,您可以使用l2_rqsts
子事件:
0x01: (name=demand_data_rd_hit) Demand Data Read requests that hit L2 cache
0x03: (name=all_demand_data_rd) Demand Data Read requests
0x04: (name=rfo_hit) RFO requests that hit L2 cache
0x08: (name=rfo_miss) RFO requests that miss L2 cache
0x0c: (name=all_rfo) RFO requests to L2 cache
0x10: (name=code_rd_hit) L2 cache hits when fetching instructions, code reads.
0x20: (name=code_rd_miss) L2 cache misses when fetching instructions
0x30: (name=all_code_rd) L2 code requests
0x40: (name=pf_hit) Requests from the L2 hardware prefetchers that hit L2 cache
0x80: (name=pf_miss) Requests from the L2 hardware prefetchers that miss L2 cache
0xc0: (name=all_pf) Requests from L2 hardware prefetchers
您可以使用 - (all_demand_data_rd - demand_data_rd_hit)
来计算需求失误
答案 1 :(得分:1)
IBM文档here可能会有所帮助。
它描述了Ivybridge上许多不同指标的各种表达方式。你想要的那个似乎是
*Instruction fetch from L2 cache miss rate*
100.0 * X_L2_RQSTS_IFETCH_MISS / X_L2_RQSTS_IFETCHES
答案 2 :(得分:0)
搜索PAPI,它是一个工具,可用于在想要收集L2缓存未命中的代码段之前和之后读取PMU。