区分黑白内存绑定和计算绑定的CUDA内核

时间:2018-02-08 16:10:11

标签: cuda opencl gpu

我正在尝试编写一个静态分析器来区分数据密集型和计算密集型CUDA内核。尽管我已就这个主题进行了研究,但目前并没有太多文献。实现此目的的一种方法是计算内核的CGMA比率。如果它太高了,那么它可能是计算密集型的,否则就会占用大量内存。

上述方法的问题在于我似乎无法确定该比率的阈值。也就是说,高于什么值应该被归类为计算密集型。一种方法是使用CUDA核心和加载/存储单元的比率作为阈值。 SO的想法是什么?

我遇到了这篇论文,他们正在计算一个名为“记忆强度”的参数。首先,他们计算一个称为活动因子的参数,然后用于计算记忆强度。请找到论文here。你可以在第6页找到记忆强度。

有没有更好的方法?由于这个原因,我很喜欢我的研究,并且迫切需要帮助。

0 个答案:

没有答案