我怎样才能获得gpu利用率?

时间:2015-05-26 07:49:44

标签: cuda gpu nvml

以前,我使用函数nvmlDeviceGetUtilizationRates()尝试了NVML。我通过这种方式测试它,当集合运行时,我在Tesla C2070上执行DFT(内核组织为< 7,32>),它有14个SM,据我所知,在GPU上有7个块在同时,利用率应为50%,但API给出的结果为99%,这意味着GPU可以完全使用。 然后,我阅读了NVML的文档,nvmlDeviceGetUtilizationRates()只能返回在GPU上执行一个或多个内核的过去采样周期内的时间间隔。 当某些内核在GPU上运行时,如何获取活动的SM编号?

0 个答案:

没有答案