我正在远程处理Linux环境中的一些CUDA程序。由于X-forwarding存在问题,我不能使用CUDA Visual Profiler,而是必须使用CUDA命令行分析器。
问题是,它无法识别我希望它遵循的一些基本计数器。例如,使用以下命令运行程序
COMPUTE_PROFILE=1 COMPUTE_PROFILE_CSV=0 COMPUTE_PROFILE_LOG=log \
CUDA_PROFILE_CONFIG=Config.txt ./my_program
Config.txt文件为:
warp_serialize
shared_replay_overhead
以下日志中的结果:
NV_Warning: Ignoring the invalid profiler config option: warp_serialize
NV_Warning: Ignoring the invalid profiler config option: shared_replay_overhead
CUDA_PROFILE_LOG_VERSION 2.0
CUDA_DEVICE 0 GeForce GTX 580
CUDA_CONTEXT 1
TIMESTAMPFACTOR fffff6c8b2653dd8
...
我的环境规范:
Card: GeForce GTX 580
CUDA Driver Version / Runtime Version: 4.1 / 4.1
CUDA Capability Major/Minor version number: 2.0
任何想法我可能做错了什么?
答案 0 :(得分:2)
计算功能2.x 的设备不支持warp_serialize
计数器 。请参阅表6. Compute Visual Profiler用户指南中的Profiler计数器类型。
关于shared_replay_overhead
我没有找到与之相关的任何内容。