对于某些CUDA应用程序配置文件,我看到本地命中率(local_hit_rate指标)的值为0%。
我想用这个值来区分以下概念。
应用程序无权访问本地缓存。
所有对本地缓存的访问均未命中。
如何找到答案?由于inst_compute_ld_st
,ldst_issued
和ldst_executed
的值不为零,丢弃第一个问题是否可以?还是还有其他东西?
设备为M2000,即 CC5.3 CC5.2
答案 0 :(得分:3)
nvprof支持事件(原始计数器)和指标。可以使用以下命令查询这些: nvprof-查询事件 nvprof --query-metrics
CC5。 / 6。本地内存策略
local_ _request是通过通用地址空间或本地地址空间执行到本地存储器的指令数。在CC5上。 /6.*,我不记得其中是否包含完整的指示说明。
local _ * _ transactions是由于请求的大小(32位,64位,...)和请求的地址差异而导致的高速缓存访问数。如果它不为零,则访问本地内存。
l2_local _ * _ bytes是已加载/存储到L2高速缓存中的数据的字节数。