标签: cuda nvidia
当我想为我的 CUDA 内核动态分配共享内存时,我注意到我可以使用总共享内存大小的一半。
当我分配更大的共享内存大小 (> 0.5*shared_memory) 时,它会触发 invalid argument error
invalid argument error
有什么原因吗? 我使用的是带有 sm_70 的 Tesla V100,它具有 96KB 的共享内存,而在分配动态共享内存时我只能使用 48KB。