CUDA变量是什么意思?
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Maximum sizes of each dimension of a block: 1024 x 1024 x 64
Maximum sizes of each dimension of a grid: 2147483647 x 65535 x 65535
例如,Maximum sizes of each dimension of a grid,
这意味着有2147483647个网格。每个网格包含65535个块?
答案 0 :(得分:2)
不,这些是您可以使用的最大硬件限制。块最大块为1024x1024x64,但每块块的线程限制为1024,因此您可以使用块尺寸1024x1x1或32x32x1等。您不能拥有更多,但当然,您可以使用更少。
通常,由您决定如何将网格设置为块尺寸(在限制范围内),这取决于您的需求。最基本的层次结构是,你有一个块网格。每个块都包含线程。因此,如果网格尺寸为2x2x2且块尺寸为16x1x1,则有8个块,每个块有16个线程,因此有128个线程正在运行。
CUDA有很好的文档,所以我建议你开始there.