我正在构建一个工作站,并希望进入一些繁重的CUDA编程。我不想全力以赴地获得特斯拉卡,并且几乎将其缩小到Quadro 4000和GeForce 480,但我真的不明白它的区别,在纸面上它看起来480有更多的核心对于4000而言,480比256,但是4000的价格几乎是480的两倍。有人理解这里的差异来证明更高的价格。
我将对它进行科学计算,因此如果它们之间存在差异,那么一切都将是双精度的。
答案 0 :(得分:36)
如果您既不关心可视化也不关心渲染(在屏幕上绘制最终结果,例如光线追踪),那么问题的答案会稍微简单一些,但不是一件容易的事。
我不打算详细介绍Quadro和GeForce显卡之间的差异,但我会强调一下有助于在它们之间进行选择的重点。
如果你需要大量内存而不是需要特斯拉或Quadro。消费卡ATM最大1.5 Gb(GTX 480),而Teslas和Quadros最大6 Gb。
GF10x系列显卡的双精度(FP64)性能上限为单精度(FP32)性能的1/8,而体系结构则为1/2。另一个市场细分技巧,现在在硬件制造商中非常流行。使GeForce系列瘫痪的目的是让特斯拉系列产品在HPC中占据优势; GTX 480实际上比特斯拉20x0更快 - 1.34TFlops对1.03 TFlops,177.4 Gb对144 Gb / sec(峰值)。
特斯拉和Quadro(应该是)进行了更彻底的测试,因此不太容易产生与游戏无关的错误,但是当涉及到科学计算时,只需一次翻转就会破坏结果。 NVIDIA声称特斯拉卡是QC-d,可全天候使用。
最近的一篇论文(Haque and Pande, Hard Data on Soft Errors: A Large-Scale Assessment of Real-World Error Rates in GPGPU)表明,特斯拉确实不易出错。
我的经验是,GeForce显卡的可靠性往往较低,特别是在高负荷下。适当的散热非常重要,同时避免使用超频卡,包括工厂过度模型(参见previously mentioned paper的图1)。
用于生产HPC /科学计算:
Quadro 如果需要FP64和/或还需要高级渲染功能(新的“Fermi”Teslas具有与GeForce类似的渲染功能)
如果您想密集使用FP64,请忘记GeForce,否则
你提到的两张牌来自完全不同的联赛,因此无法直接比较。如果您需要,Quadro的渲染功能将获得Quadro。否则,Quadro并不值得,特别是4000不比GTX 460慢,而且价格要高出3.5倍。我认为你最好使用GTX 470或480,只需确保购买标准频率的产品。
请注意,在此比较中,瘫痪的GeForce双精度性能不是问题,但让我详细说明。由于Quadro 4000是一款低端型号,AFAIR只有450 MHz着色器(我找不到参考ATM,但它应该绝对低于5000的时钟频率为513 MHz),这使它大约有115个GFlops FP64。与此同时,上限GTX 480约为168 GFlops FP64,甚至GTX 460约为113 GFlops(峰值)。 Quadro 4000上的FP32性能和内存带宽都低于GTX 480(86.9 vs 177.4 GB / s)!
请注意,从理论峰值性能的角度来看,GTX 480(data sheet)比Tesla C2050/2070和Quadro 6000快得多,这在大多数应用程序中得到反映。
答案 1 :(得分:7)
上面没有提到的Quadro / Tesla卡有一些小优点:
当然,这些优点对大多数人来说没有任何区别。但是,对于某些用途,它们至关重要。
答案 2 :(得分:1)
游戏玩家的优势" GPU(GeForce GTX系列,如GTX 780)"专业"用于CUDA编程的GPU(Tesla系列和Quadro系列)是:
但是
显然,GPU的选择取决于您在应用程序中的需求。但我认为对于大多数应用程序来说GTX是更好的选择。例如,在许多图像处理应用中,单精度就足够了,考虑到性能和价格,GTX显然是更好的选择。例如,在由OpenCV GPU库的主要开发人员编写的this article中,作者使用NVidia GTX 580对CPU的结果进行基准测试。如果您需要更好的双精度性能或更多内存,我会说Quadro或Tesla。
答案 3 :(得分:0)
看看规格并不明显,但我认为您对双精度的需求表明Quadro 4000更适合。虽然GeForce 480拥有更多内核和两倍的内存带宽,但它的核心是游戏卡。 Quadros的目标是专业工作,并因此得到更好的支持。此外,Quadro可以进行64倍抗锯齿(相对于GeForce的32倍)这一事实表明功能更强大的卡。