我知道可以使用三重括号语法启动内核:
kernel<<<NumOfBlocks, NumOfThreadsPerBlock, A, B>>> (...);
最后两个参数是可选的,但我想知道它们是指什么。 B应该引用应该执行内核的流,但是A?
呢?答案 0 :(得分:3)
这是共享内存的数量。您可以在共享内存中传递所需的字节数。在内核中你应该使用
extern __shared__ T smem[];
而不是
__shared__ T[CONSTANT];
获取内核中大小为A / sizeof(T)的共享数组。