sdk - 需要哪些卡和计算功能才能充分利用CUDA 5的功能 - Thinbug

需要哪些卡和计算功能才能充分利用CUDA 5的功能

时间：2012-10-19 06:44:29

标签： sdk cuda language-features computer-architecture

我们刚刚收到了CUDA 5的稳定版本。有一些像Kepler这样的新术语，能够使用性能更好的MPI，同时运行32个应用程序的同一张卡。我有点困惑，并寻找这些问题的答案：

充分利用CUDA 5的功能需要哪些卡和计算功能？
新功能仅适用于Kepler架构，如GPUDirect，动态并行，Hyper Q和动态并行。
如果我们有Fermi架构，使用CUDA 5会带来哪些好处。除了在Linux和Eclipse上使用NSight之外，它还能带来什么好处。我认为最重要的特征是建立图书馆的能力？
您是否看到从CUDA 4到CUDA 5的任何性能改进。（我在Linux机器上获得了一些加速）

我发现了一些像

这样的文件

然而，更好，简短的描述可能会使我们的思想更清晰。

PS：请不要限制上述问题的答案。我可能会遗漏一些类似的问题。

1 个答案:

答案 0 :(得分：5)

动态并行性需要计算能力3.5（例如GK110），因为早期的GPU没有线程启动内核或直接将其他API调用注入硬件命令队列所需的硬件。

Hyper-Q需要计算能力3.5。

SHFL内在函数需要CC 3.0（GK104）

CUDA 5中的设备代码链接，NSight EE，nvprof，性能改进和错误修复使Fermi和早期的GPU受益。