在GPU上编程时调试内核函数有什么好办法吗?
我使用的方法是使用printf(...)
或将结果复制回CPU,然后查看它们。
我觉得调试太费时了。
我感谢您的建议。谢谢。
答案 0 :(得分:1)
使用调试器怎么样?
如果您在Windows上,则可以使用VisualStudio调试器。 如果您使用的是linux(更好),可以使用cuda-gdb。
创建适当内核的典型方法是:
首先只为cpu实现简单的算法。 然后从最简单的方式开始创建内核,上传/下载数据 并将第一个简单内核的结果与正确的cpu内核的结果进行比较。
然后开始添加复杂性并创建新版本的内核。
答案 1 :(得分:1)
如果您使用的是Windows,请务必尝试NVIDIA Parallel Nsight(Nvidia的官方调试工具)