gpgpu着色器中的1000立方体素,10亿布尔,是否消耗了大约一个内存的陀螺仪?
资源限制页面没有说明GPU中2d和3d数组的任何索引限制。它们理论上是成千上万还是数万亿?
答案 0 :(得分:0)
对于计算能力> = 3.0,最大网格尺寸为2147483647x65535x65535, 因此,对于任何应该涵盖任何尺寸的一维数组,最高可达2147483647x1024 = 2.1990233e + 12.
我使用了10亿的数组都没问题。
1,000,000,000 / 1024 = 976562.5,并向上舍入到976563个块...如果threadIdx.x + blockIdx.x * blockDim.x> =您从内核返回的元素数量未经处理。