sdk设备查询示例和占用计算器之间的不同声明?

时间:2013-01-24 07:39:02

标签: cuda

目前我尝试更好地占用内核并使用占用计算器和我从sdk示例devicequery获得的设备信息。 我想知道块和流多处理器(sm)的声明略有不同。 在sdk示例中,它被称为

  

每个块的共享内存总量

  

每个块可用的寄存器总数

但是在占用率计算器中,这些信息是按sm计算的,这对我来说更有意义。

这只是sdk示例中的错误声明吗?

1 个答案:

答案 0 :(得分:0)

我同意你的看法。

共享内存和寄存器是硬件资源,但是块是软件编程模型的概念。

另一方面,我认为我们可以说一个块可以使用的共享内存的最大数量等于GPU设备的每个多处理器的共享内存总量。

官方文档CUDA编程指南也使用术语“每个多处理器的共享内存”,如Compute Capabilities;

部分所示。