我在.cu文件中写了一个简单的cuda程序。当我想看到这个节目的表现。我选择" Nsight->启动性能分析...."然后选择" Profile CUDA Application"。在启动应用程序一段时间并完成捕获后,报告称"没有捕获内核启动"摘要报告说"遇到1个错误"。有人可以帮我弄清楚为什么会这样吗?
答案 0 :(得分:2)
在您的样本中完成所有CUDA工作后,您是否致电cudaDeviceSynchronize()
或cudaDeviceReset()
?否则,Nsight无法保证刷新所有启动和memcpy记录缓冲区。