目前我尝试更好地占用内核并使用占用计算器和我从sdk示例devicequery获得的设备信息。 我想知道块和流多处理器(sm)的声明略有不同。 在sdk示例中,它被称为
每个块的共享内存总量
和
每个块可用的寄存器总数
但是在占用率计算器中,这些信息是按sm计算的,这对我来说更有意义。
这只是sdk示例中的错误声明吗?
答案 0 :(得分:0)
我同意你的看法。
共享内存和寄存器是硬件资源,但是块是软件编程模型的概念。
另一方面,我认为我们可以说一个块可以使用的共享内存的最大数量等于GPU设备的每个多处理器的共享内存总量。
官方文档CUDA编程指南也使用术语“每个多处理器的共享内存”,如Compute Capabilities;
部分所示。