我无法理解这个概念。我在线研究了很多,我唯一理解的是线程需要访问连续数据。
因此,如果我们有一个10000个整数的数组,如果线程i
访问i
- 数组的数量,那么内存将会合并。
如果不是所有整数都有10000个线程,我们决定拥有500个线程,每个线程访问两个连续的整数,怎么办?在这种情况下,内存合并是否可行?
如果我们决定允许一个线程访问超过2个值,例如10,该怎么办?
在这种情况下,内存合并会如何表现?在上面描述的例子中,“连续访问”何时停止“连续”?
提前谢谢
答案 0 :(得分:1)
我无法理解这个概念
这不是简短描述中可以完全涵盖的内容,特别是对于您可能发生的所有澄清问题。
我的建议是选择其中一个webinars:
使用CUDA C进行GPU计算 - 高级1(2010)
CUDA Global Memory Usage&战略+现场Q& A与Justin Luitjens博士,NVIDIA
如果您有基于对该主题的一般理解的具体问题,请回来。