我想在我的CUDA程序中使用dim3
网格,但在初始化时不知道参数(需要先计算它们)。有一种简单的方法可以解决这个问题吗?
当然我可以在内核调用的括号中传递参数,例如如果我的参数是m和n:kernel<<<m*n, thread_size>>>(...)
但后来我需要重新计算指数。
答案 0 :(得分:5)
dim3
是一个整数结构类型,在文件vector_types.h
中定义为
struct __device_builtin__ dim3
{
unsigned int x, y, z;
#if defined(__cplusplus)
__host__ __device__ dim3(unsigned int vx = 1, unsigned int vy = 1, unsigned int vz = 1) : x(vx), y(vy), z(vz) {}
__host__ __device__ dim3(uint3 v) : x(v.x), y(v.y), z(v.z) {}
__host__ __device__ operator uint3(void) { uint3 t; t.x = x; t.y = y; t.z = z; return t; }
#endif /* __cplusplus */
};
您可以将dim3
变量定义为
dim3 grid(256); // defines a grid of 256 x 1 x 1 blocks
dim3 block(512,512); // defines a block of 512 x 512 x 1 threads
并将其用作
foo<<<grid,block>>>(...);
如果您有兴趣,您将拥有
dim3 grid(m*n);
dim3 block(thread_size);
kernel<<<grid,block>>>(...)
根据dim3
的定义,不需要明确初始化grid
和block
的字段。初始化期间未提供的任何字段都初始化为1.
您可以使用
这样的作业更改grid
和block
的字段
grid.x = 512;
block.y = 64;