标签: c++ cuda statistics profiling
我有一些来自SDK示例的CUDA / C ++文件。我想做统计 - 计算最频繁发生的函数调用。例如。 cudaFree或cudaMalloc可能会名列前茅。无论如何,有没有很好的分析工具或脚本来做到这一点?