CUDA dim3网格绕过初始化

时间:2013-09-12 15:20:13

标签: cuda initialization

我想在我的CUDA程序中使用dim3网格,但在初始化时不知道参数(需要先计算它们)。有一种简单的方法可以解决这个问题吗?

当然我可以在内核调用的括号中传递参数,例如如果我的参数是m和n:kernel<<<m*n, thread_size>>>(...) 但后来我需要重新计算指数。

1 个答案:

答案 0 :(得分:5)

dim3是一个整数结构类型,在文件vector_types.h中定义为

struct __device_builtin__ dim3
{
    unsigned int x, y, z;
#if defined(__cplusplus)
    __host__ __device__ dim3(unsigned int vx = 1, unsigned int vy = 1, unsigned int vz = 1) : x(vx), y(vy), z(vz) {}
    __host__ __device__ dim3(uint3 v) : x(v.x), y(v.y), z(v.z) {}
    __host__ __device__ operator uint3(void) { uint3 t; t.x = x; t.y = y; t.z = z; return t; }
#endif /* __cplusplus */
};

您可以将dim3变量定义为

dim3 grid(256);            // defines a grid of 256 x 1 x 1 blocks
dim3 block(512,512);       // defines a block of 512 x 512 x 1 threads

并将其用作

foo<<<grid,block>>>(...);

如果您有兴趣,您将拥有

dim3 grid(m*n);
dim3 block(thread_size);
kernel<<<grid,block>>>(...)

根据dim3的定义,不需要明确初始化gridblock的字段。初始化期间未提供的任何字段都初始化为1.

您可以使用

这样的作业更改gridblock的字段
grid.x = 512;
block.y = 64;