有没有在CUDA中创建超过65535个块?
如果我理解正确,则块中的最大线程数为1024(CUDA 8)。因此,它可以形成2 ^ 16(块)* 2 ^ 10(线程)空间。
无论如何都要创建一个2 ^ 32位的空间?
我想做的是总共创建2 ^ 32个线程。一个简单的例子是,我使用了4GB内存,我希望用1到0xffffffff的计数器来填充内存。
答案 0 :(得分:3)
如果您阅读documentation的相关部分,您会看到您的GPU在一维网格中支持2 ^ 31 - 1个块。所以是的,有办法 如果你愿意的话,用2 ^ 32个线程创建一个内核启动(不是在这种情况下是必要的或可行的)。