在使用NSight配置我的CUDA应用程序后,我在“问题效率”下看到了这一点:
点击上图所示面板中的有用帮助链接后,我在文档中找到了此说明:
管道繁忙 - 指令所需的计算资源尚不可用。
有关确定哪些计算资源尚不可用的建议以及原因?
答案 0 :(得分:3)
您可以运行管道利用率实验来查看繁忙的内容。来自User Guide:
CUDA设备的每个流式多处理器(SM)都具有众多功能 专门执行特定任务的硬件单元。在 芯片级别这些单元提供执行流水线 warp调度程序将指令分派给。例如,纹理单位 提供执行纹理提取和执行纹理的功能 过滤。加载/存储单元获取数据并将数据保存到内存。 了解这些管道的利用率并了解有多接近 它们对目标设备的峰值性能至关重要 用于分析执行内核效率的信息;和 还可以识别由此引起的性能瓶颈 超额订阅某种类型的管道。