标签: cuda
我有一个程序,我尝试将主机功能与GPU内核重叠。为了检查主机功能与GPU内核的重叠程度,我使用的是NVIDIA的可视化分析器。但是,探查器不会显示我的主机功能的任何计时结果。相反,它只显示CUDA内核的CPU时间。
有没有办法将主机功能的计时结果整合到视觉分析器的时间线中?
答案 0 :(得分:6)
是的,这是可能的。请查看profiler manual。
您可能希望mark a range围绕要检查重叠的主机代码部分。