我正在分析CUDA应用程序,并将日志转储到文件target.prof
我的应用程序使用多个线程调度内核,我只想观察其中一个线程的api调用。
我尝试使用nvprof -i target.prof --print-api-trace
,但这不会显示thread_id。
当我使用可视分析器打开该文件时,我可以看到从哪个线程启动了哪些API调用。如何使用命令行分析器访问相同的信息?
编辑:在可视分析器中查看
答案 0 :(得分:-1)
GPU线程是否正在启动这些内核或CPU线程?如果使用cpu线程,则使用选项--cpu-thread-tracing on
。