我想将SM的所有可用共享内存分配给一个块。我这样做是因为我不希望将多个块分配给同一个SM。 我的GPU卡有64KB(共享+ L1)内存。在我当前的配置中,48KB分配给共享内存,16KB分配给L1。 我编写了以下代码来耗尽所有可用的共享内存。
__global__ void foo()
{
__shared__ char array[49152];
...
}
我有两个问题:
提前致谢,
伊曼
答案 0 :(得分:2)
cudaDeviceProp::sharedMemPerBlock
来了解cudaGetDeviceProperties
中可用设备共享内存的大小“clock”CUDA SDK示例说明了如何在启动时指定共享内存大小。