NSight Profiling - 如何解决“Pipe Busy”摊位?

时间:2014-10-15 18:36:59

标签: cuda nsight

在使用NSight配置我的CUDA应用程序后,我在“问题效率”下看到了这一点:

enter image description here

点击上图所示面板中的有用帮助链接后,我在文档中找到了此说明:

管道繁忙 - 指令所需的计算资源尚不可用。

有关确定哪些计算资源尚不可用的建议以及原因?

1 个答案:

答案 0 :(得分:3)

您可以运行管道利用率实验来查看繁忙的内容。来自User Guide

  

CUDA设备的每个流式多处理器(SM)都具有众多功能   专门执行特定任务的硬件单元。在   芯片级别这些单元提供执行流水线   warp调度程序将指令分派给。例如,纹理单位   提供执行纹理提取和执行纹理的功能   过滤。加载/存储单元获取数据并将数据保存到内存。   了解这些管道的利用率并了解有多接近   它们对目标设备的峰值性能至关重要   用于分析执行内核效率的信息;和   还可以识别由此引起的性能瓶颈   超额订阅某种类型的管道。