CUDA - 更多SM或更高的时钟频率?

时间:2013-05-23 10:14:52

标签: cuda nvidia nsight

当CUDA内核速度执行至关重要时,更重要的是什么?核心的频率或SM的数量?

我可以在Quadro K5000和Gtx 670之间进行选择,我无法决定。在两种情况下,内存似乎都足够了,但是quadro有更多的SM,而Gtx有更高的时钟频率(我想这个值是每个核心)。

2 个答案:

答案 0 :(得分:2)

取决于您要执行的操作。您的程序是否会使用Quadro的所有内核?如果没有,Gtx会更快。如果它和Gtx需要超过1格,你应该做数学,但Quadro可能会更快。

答案 1 :(得分:2)

Quadro K5000和GTX670都基于相同的GK104芯片。 Quadro在GTX470上有8个SM而不是7个。 GTX670的运行速度为915Mhz,而Quadro的运行速度为706Mhz,因此GTX670的整体吞吐量更高。 Quadro的带宽为172GB / s,而GTX670的带宽为192GB / s,因此GTX670的带宽也更好。

如果决定完全基于速度,请使用GTX670。如果预算允许,您可能还需要考虑GTX780或Titan。

this textbook第11章介绍了选择哪种GPU卡及其原因的问题。