我想在执行CUDA
内核时检查设备上的可用内存。 cuMemGetInfo
(& free,& total)是基于主机(CPU)的命令,它在设备上提供空闲内存。
但有没有办法在执行期间检查CUDA
内核代码中的空闲内存?
答案 0 :(得分:2)
使用分析器 - NVIDIA Visual Profiler
是一个跨平台的性能分析工具,可为开发人员提供优化CUDA C/C++
应用程序的重要反馈。
Visual Profiler于2008年首次推出,支持自2006年以来在Linux,Mac OS X和Windows上运送的所有3.5亿+ CUDA支持的NVIDIA GPU。
NVIDIA Visual Profiler作为CUDA工具包的一部分提供。
请参阅用户指南Here