可以在共享内存CUDA中保存的数据量

时间:2016-11-22 20:49:24

标签: cuda

在我的gpu max每个块的线程是1024.我正在使用CUDA处理图像处理项目。现在,如果我想使用共享内存,则意味着我只能使用一个块使用1024个像素,并且只需要将这1024个元素复制到共享内存

1 个答案:

答案 0 :(得分:1)

你的问题很不清楚,所以我会回答标题中的问题。

CUDA中共享内存中可容纳的数据量取决于GPU的计算能力。 例如,在CC 2.x和3.x上:

  

在计算能力2.x和3.x的设备上,每个多处理器都有64KB的片上内存,可以在L1缓存和共享内存之间进行分区。

请参阅 配置共享内存量 部分:Nvidia Parallel Forall Devblog : Using Shared Memory in CUDA C/C++

您必须考虑的优化是通过映射线程来避免银行冲突。访问存储库。这是在本博客中介绍的,您应该阅读它。