NVIDIA Visual Profiler可以显示并发内核执行吗?

时间:2012-08-07 12:33:12

标签: cuda nvvp

我在很多论坛上都看到NVIDIA Visual Profiler将程序序列化以收集时间信息。

然而,在视觉分析器中,在上下文选项卡下,提供诸如“GPU上的内存副本和内核之间没有时间重叠”之类的建议,或者如果内存与内核执行重叠则显示重叠的时间。此外,如果查看the following webinar - slide 6,您可以看到重叠内核的输出跟踪。

我想知道探查器是否可以显示有关并发内核执行的信息(即如果我们使用3个不同的流并行运行3个内核,探查器是否可以显示这是否确实发生在GPU中)。如果是这样,我可以在视觉分析器中获取此信息。

1 个答案:

答案 0 :(得分:2)

CUDA Toolkit 5.0中的nvprof和Visual Profiler(nvvp)(作为已注册CUDA开发人员的预览版本提供)支持并发内核执行。