我正在尝试使用Nvidia nvprof
来分析我的CUDA和OpenCL程序。但是,无论我选择哪种基准,唯一的输出是======== Error: application not found.
我已经尝试了CUDA和OpenCL基准测试,并重新编译了几次,但似乎无能为力。
我的CUDA版本:4.2
NVIDIA驱动程序版本:334.21
答案 0 :(得分:5)
与AMD sprofile不同,Linux上的应用程序名称之前需要./
。
所以你可以用这个命令调用探查器:
nvprof ./ApplicationName