我想从GPU应用程序中提取数据以检查其限制。我必须使用 nvprof 因为应用程序在远程服务器上运行,所以我应该在 Visual Profiler 中创建一个本地导入的文件。我尝试使用nvprof -o file_name <app> <params>
和nvprof --analysis-metrics --output-profile file_name <app> <params>
创建文件但是当我在Visual Profiler上导入这些文件时,在 Analysis 部分中,某些字段为空:“不足全局内存加载数据“,”全局内存存储数据不足“,”内核SM数据不足“......我怎样才能生成一个(或更多)文件以获取Analysis部分的所有信息?我用 nvcc 编译带有标志-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v
的cuda代码。
以下是空字段的一些示例: