Nvprof:错误的结果

时间:2017-11-12 21:56:28

标签: cuda gpu gpgpu gpu-programming nvprof

我正在尝试使用gld_throughput衡量内核的gst_throughputnvprof。我的kenrel是两个具有不同尺寸的阵列的乘法。突然之间,我测量了巨大阵列(8192x8192)乘法的吞吐量,结果是" OVERFLOW"这一切都很棒。在此之后,当我测量我已测量的较小阵列的乘法吞吐量时,吞吐量远小于我的吞吐量。但执行时间总是一样的。所以我认为小吞吐量是不正确的,因为如果是,我的执行时间会更大。 有什么想法吗?

0 个答案:

没有答案