为什么CUDA命令行分析器无法识别某些计数器?

时间:2012-02-26 12:45:55

标签: cuda profiler

我正在远程处理Linux环境中的一些CUDA程序。由于X-forwarding存在问题,我不能使用CUDA Visual Profiler,而是必须使用CUDA命令行分析器。

问题是,它无法识别我希望它遵循的一些基本计数器。例如,使用以下命令运行程序

COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log  \
CUDA_PROFILE_CONFIG=Config.txt ./my_program

Config.txt文件为:

warp_serialize
shared_replay_overhead

以下日志中的结果:

NV_Warning: Ignoring the invalid profiler config option: warp_serialize
NV_Warning: Ignoring the invalid profiler config option: shared_replay_overhead
CUDA_PROFILE_LOG_VERSION 2.0
CUDA_DEVICE 0 GeForce GTX 580
CUDA_CONTEXT 1
TIMESTAMPFACTOR fffff6c8b2653dd8

...

我的环境规范:

Card: GeForce GTX 580
CUDA Driver Version / Runtime Version:          4.1 / 4.1
CUDA Capability Major/Minor version number:    2.0

任何想法我可能做错了什么?

1 个答案:

答案 0 :(得分:2)

计算功能2.x 的设备不支持warp_serialize计数器 。请参阅表6. Compute Visual Profiler用户指南中的Profiler计数器类型。

关于shared_replay_overhead我没有找到与之相关的任何内容。