CUDA:什么时候有人可以实现合并记忆?

时间:2013-06-24 21:30:36

标签: memory cuda gpu-programming coalescing

我无法理解这个概念。我在线研究了很多,我唯一理解的是线程需要访问连续数据。

因此,如果我们有一个10000个整数的数组,如果线程i访问i - 数组的数量,那么内存将会合并。

如果不是所有整数都有10000个线程,我们决定拥有500个线程,每个线程访问两个连续的整数,怎么办?在这种情况下,内存合并是否可行?

如果我们决定允许一个线程访问超过2个值,例如10,该怎么办?

在这种情况下,内存合并会如何表现?在上面描述的例子中,“连续访问”何时停止“连续”?

提前谢谢

1 个答案:

答案 0 :(得分:1)

  

我无法理解这个概念

这不是简短描述中可以完全涵盖的内容,特别是对于您可能发生的所有澄清问题。

我的建议是选择其中一个webinars

  

使用CUDA C进行GPU计算 - 高级1(2010)

     

CUDA Global Memory Usage&战略+现场Q& A与Justin Luitjens博士,NVIDIA

如果您有基于对该主题的一般理解的具体问题,请回来。