我的程序的二进制文件是用nvcc编译器生成的。我想用nvprof来描述它。我尝试使用nvprof ./a.out
并显示每个函数的秒数。虽然这对我有好处,但我希望看到我的申请时间表。如果我用Nsight构建我的项目,我可以很容易地做到这一点,但遗憾的是我无法做到这一点。那么,如何在Nsight外部调用nvprof程序以查看我的应用程序的时间表?
答案 0 :(得分:2)
您可以通过以下几种方式查看时间表:
在CUDA中使用独立的GUI配置文件工具nvvp,如果/usr/local/cuda/bin
中存在$PATH
(默认CUDA安装二进制目录),则可以通过以下cmdline启动。然后,您可以在nvvp GUI中查看a.out
以对其进行分析并显示时间线。
$ nvvp
使用带有nvprof
选项的cmdline工具-o
生成结果文件,该文件可以由Nsight和/或nvvp导入以显示时间轴。 user manual of nvprof提供了更多详细信息。
$ nvprof -o profile.result ./a.out