Cuda网格尺寸限制似乎低于应有的范围

时间:2016-04-15 18:57:12

标签: parallel-processing cuda

我有一台GTX780。它具有计算能力3.5,根据维基百科和直接查询设备的代码输出。根据两者,它的块x尺寸限制为2 ^ 31-1(2147483647)。但是,如果IconTabBar(65535),以下代码仅成功设置a[0]=1。这是版本2.x及更早版本的维基百科列出的限制。

blocks < 2^16-1

1 个答案:

答案 0 :(得分:0)

基本相同problem as here。我需要使用-arch=sm_35标记专门编译。

nvcc -arch=sm_35 sandbox.cu -o sandbox.exe