如何使用nvprof打印每个线程的api调用

时间:2018-09-12 05:28:28

标签: cuda gpu nvidia nvprof nvvp

我正在分析CUDA应用程序,并将日志转储到文件target.prof

我的应用程序使用多个线程调度内核,我只想观察其中一个线程的api调用。 我尝试使用nvprof -i target.prof --print-api-trace,但这不会显示thread_id。

当我使用可视分析器打开该文件时,我可以看到从哪个线程启动了哪些API调用。如何使用命令行分析器访问相同的信息?

编辑:在可视分析器中查看

Visual Profiler showing multiple threads

1 个答案:

答案 0 :(得分:-1)

GPU线程是否正在启动这些内核或CPU线程?如果使用cpu线程,则使用选项--cpu-thread-tracing on