标签: cuda opencl nvidia
在CUDA(和OpenCL)中,线程/块的索引可以是1D,2D或3D。
这是否只是为了方便程序员,还是使用它们时确实会带来性能上的好处,而不是例如使用mod和div将整数索引映射到2个值?