当CUDA内核速度执行至关重要时,更重要的是什么?核心的频率或SM的数量?
我可以在Quadro K5000和Gtx 670之间进行选择,我无法决定。在两种情况下,内存似乎都足够了,但是quadro有更多的SM,而Gtx有更高的时钟频率(我想这个值是每个核心)。
答案 0 :(得分:2)
取决于您要执行的操作。您的程序是否会使用Quadro的所有内核?如果没有,Gtx会更快。如果它和Gtx需要超过1格,你应该做数学,但Quadro可能会更快。
答案 1 :(得分:2)
Quadro K5000和GTX670都基于相同的GK104芯片。 Quadro在GTX470上有8个SM而不是7个。 GTX670的运行速度为915Mhz,而Quadro的运行速度为706Mhz,因此GTX670的整体吞吐量更高。 Quadro的带宽为172GB / s,而GTX670的带宽为192GB / s,因此GTX670的带宽也更好。
如果决定完全基于速度,请使用GTX670。如果预算允许,您可能还需要考虑GTX780或Titan。
this textbook第11章介绍了选择哪种GPU卡及其原因的问题。