我有一个Cuda申请;在为各种阵列首次分配cuda内存之后,程序循环执行:将数据传输到GPU,在GPU上处理内核,从GPU传输数据。第一个数据集由GPU正确处理并返回。此后,后续数据集生成错误9:无效配置。
由于我没有取消或重新分配记忆,我不相信我的记忆力不足。我已经对网格和块尺寸进行了三次检查,这些都在边界内:(200,0,0)和(720,20,0)。
我还应该注意什么才能理解无效的配置是什么?
答案 0 :(得分:3)
我已经对网格和块尺寸进行了三次检查,这些都在边界内:(200,0,0)和(720,20,0)。
y和z维度不能为零。它们必须至少为1。
=> (200,1,1)和(720,20,1)