我正在试图描述在GTX 650上执行的CUDA rodinia基准测试。 我使用代码/usr/local/cuda-5.0/extras/CUPTI/samples/event_sampling来读取 指令执行计数器。我觉得没有任何变化似乎很奇怪 event_sampling报告的值是否正在执行CUDA基准测试。
event_sampling代码还有一些自己的计算,用于测量执行的指令。与CPU不同,我是否需要更改应用程序的源代码才能读取GPU计数器等GPU计数器?
答案 0 :(得分:1)
CUPTI只会在同一进程中为您提供内核的计数器更新。您可以使用NVIDIA可视化分析器或相关环境变量获得其中一些值,但不是达到相同的精度水平,但不修改代码。