CUDA:计算能力为1.0的设备的线程块限制是什么?

时间:2018-12-14 08:36:29

标签: cuda gpu gpgpu tesla

最近,我正在阅读《大规模并行处理器编程》一书。第3章中的一项阅读练习要求我检测SM的哪种分配是可能的。问题看起来像下面的

指出每个多处理器可以进行以下哪些分配:

  1. 在具有1.0计算能力的设备上,每个模块有8个块,每个块具有128个线程。
  2. 在具有1.2计算能力的设备上,每个模块有8个块,每个块具有128个线程。
  3. 具有3.0计算能力的设备上的8个块,每个块具有128个线程。
  4. 具有1.0计算能力的设备上的16个块,每个块具有64个线程。
  5. 具有1.2计算能力的设备上的16个块,每个块具有64个线程。
  6. 具有3.0计算能力的设备上的16个块,每个块具有64个线程。

在最新的CUDA编程协会中,我仅找到计算能力3.0的规范,该规范允许每个SM最多16个块和2048个线程,每个块最多1024个线程。不幸的是,我没有找到与计算能力1.0相关的任何信息。

谁能告诉我在哪里可以找到计算能力1.0的块规范?非常感谢

1 个答案:

答案 0 :(得分:1)

请参阅CUDA in Wikipedia页,所有设备都有有效的规范。将在计算功能(版本)部分中。

但是这里有一张照片:

enter image description here