在具有计算能力<= 7.2的设备上,我始终使用
nvprof --events shared_st_bank_conflict
但是当我在带有CUDA10的RTX2080ti上运行它时,它会返回
Warning: Skipping profiling on device 0 since profiling is not supported on devices with compute capability greater than 7.2
那么我如何检测此设备上是否存在共享存储库冲突?
我已经安装了Nvidia Nsight系统和Nsight Compute,找不到此类性能分析报告...
thinks
答案 0 :(得分:1)
这似乎是一个问题,已在NVIDIA论坛的this帖子中得到了解决。显然,应该使用Nsight工具之一(CLI或UI)来支持它。
答案 1 :(得分:0)
您可以使用--metrics
任何一个
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_ld.sum
或
nv-nsight-cu-cli --metrics l1tex__data_bank_conflicts_pipe_lsu_mem_shared_op_st.sum