memory - CUDA：什么时候有人可以实现合并记忆？

时间：2013-06-24 21:30:36

标签： memory cuda gpu-programming coalescing

我无法理解这个概念。我在线研究了很多，我唯一理解的是线程需要访问连续数据。

因此，如果我们有一个10000个整数的数组，如果线程i访问i - 数组的数量，那么内存将会合并。

如果不是所有整数都有10000个线程，我们决定拥有500个线程，每个线程访问两个连续的整数，怎么办？在这种情况下，内存合并是否可行？

如果我们决定允许一个线程访问超过2个值，例如10，该怎么办？

在这种情况下，内存合并会如何表现？在上面描述的例子中，“连续访问”何时停止“连续”？

提前谢谢

答案 0 :(得分：1)

我无法理解这个概念

这不是简短描述中可以完全涵盖的内容，特别是对于您可能发生的所有澄清问题。

我的建议是选择其中一个webinars：

使用CUDA C进行GPU计算 - 高级1（2010）

CUDA Global Memory Usage＆amp;战略+现场Q＆amp; A与Justin Luitjens博士，NVIDIA

如果您有基于对该主题的一般理解的具体问题，请回来。