l1用于CUDA CC 3.0的共享银行冲突分析器计数器

时间:2012-12-17 06:22:30

标签: cuda gpu profiler

CUDA与CC 3.0的新l1_shared_bank_conflict(或等效)计数器是什么? 在CUPTI用户指南中,它说shared_ [load | store] _bank_conflict,但是当我尝试时它没有显示。

我在Linux中使用命令行分析器。

1 个答案:

答案 0 :(得分:3)

旧命令行分析器不支持某些新计数器。如果您使用的是CUDA 5,可以尝试使用nvprof:

nvprof --events l1_shared_bank_conflict <app_name>

nvprof --query-events

请参阅http://docs.nvidia.com/cuda/profiler-users-guide/index.html#nvprof-overview