使用Compute Prof(Cuda / OpenCL)的每个块的静态分配共享内存的大小

时间:2010-10-13 20:39:12

标签: cuda profiling opencl nvidia

在Nvidia的计算教程中,有一个名为“每个工作组的静态私有内存”的列,其工具提示为“每个块的静态分配共享内存的大小”。我的应用程序显示每个块我得到64(我假设的字节)。这是否意味着我在这些字节的1-64之间使用,或者是分析器只是告诉我这个共享内存的数量已分配,谁知道它是否被使用了?

1 个答案:

答案 0 :(得分:1)

如果已分配,可能是因为您使用过它。 AFAIK CUDA通过共享内存将参数传递给内核,因此必须如此。