CUDA:如何使用计算能力> = 7.2检测设备上的共享内存库冲突?

时间:2019-03-22 10:10:16

标签: cuda nsight

在具有计算能力<= 7.2的设备上,我始终使用

nvprof --events shared_st_bank_conflict

但是当我在带有CUDA10的RTX2080ti上运行它时,它会返回

Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2

那么我如何检测此设备上是否存在共享存储库冲突?

我已经安装了Nvidia Nsight系统和Nsight Compute,找不到此类性能分析报告...

thinks

2 个答案:

答案 0 :(得分:1)

这似乎是一个问题,已在NVIDIA论坛的this帖子中得到了解决。显然,应该使用Nsight工具之一(CLI或UI)来支持它。

答案 1 :(得分:0)

您可以使用--metrics

任何一个

nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum

nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum