hardware - 与CUDA硬件Quadro 4000 Vs的区别GeForce 480

与CUDA硬件Quadro 4000 Vs的区别GeForce 480

时间：2010-09-15 20:23:36

标签： hardware cuda

我正在构建一个工作站，并希望进入一些繁重的CUDA编程。我不想全力以赴地获得特斯拉卡，并且几乎将其缩小到Quadro 4000和GeForce 480，但我真的不明白它的区别，在纸面上它看起来480有更多的核心对于4000而言，480比256，但是4000的价格几乎是480的两倍。有人理解这里的差异来证明更高的价格。

我将对它进行科学计算，因此如果它们之间存在差异，那么一切都将是双精度的。

4 个答案:

答案 0 :(得分：36)

如果您既不关心可视化也不关心渲染（在屏幕上绘制最终结果，例如光线追踪），那么问题的答案会稍微简单一些，但不是一件容易的事。

我不打算详细介绍Quadro和GeForce显卡之间的差异，但我会强调一下有助于在它们之间进行选择的重点。

一般来说：

如果你需要大量内存而不是需要特斯拉或Quadro。消费卡ATM最大1.5 Gb（GTX 480），而Teslas和Quadros最大6 Gb。
GF10x系列显卡的双精度（FP64）性能上限为单精度（FP32）性能的1/8，而体系结构则为1/2。另一个市场细分技巧，现在在硬件制造商中非常流行。使GeForce系列瘫痪的目的是让特斯拉系列产品在HPC中占据优势; GTX 480实际上比特斯拉20x0更快 - 1.34TFlops对1.03 TFlops，177.4 Gb对144 Gb / sec（峰值）。
特斯拉和Quadro（应该是）进行了更彻底的测试，因此不太容易产生与游戏无关的错误，但是当涉及到科学计算时，只需一次翻转就会破坏结果。 NVIDIA声称特斯拉卡是QC-d，可全天候使用。

最近的一篇论文（Haque and Pande, Hard Data on Soft Errors: A Large-Scale Assessment of Real-World Error Rates in GPGPU）表明，特斯拉确实不易出错。
我的经验是，GeForce显卡的可靠性往往较低，特别是在高负荷下。适当的散热非常重要，同时避免使用超频卡，包括工厂过度模型（参见previously mentioned paper的图1）。

所以作为经验法则：

for development ： GeForce （除非您绝对需要＆gt; 1.5 Gb内存）
用于生产HPC /科学计算：
- 特斯拉：如果您需要大量内存或FP64（+可靠性？）
- Quadro 如果需要FP64和/或还需要高级渲染功能（新的“Fermi”Teslas具有与GeForce类似的渲染功能）
  
  如果您想密集使用FP64，请忘记GeForce，否则
- **非工厂超频* GeForce *：省钱;）

回到你问题的具体细节：

你提到的两张牌来自完全不同的联赛，因此无法直接比较。如果您需要，Quadro的渲染功能将获得Quadro。否则，Quadro并不值得，特别是4000不比GTX 460慢，而且价格要高出3.5倍。我认为你最好使用GTX 470或480，只需确保购买标准频率的产品。

请注意，在此比较中，瘫痪的GeForce双精度性能不是问题，但让我详细说明。由于Quadro 4000是一款低端型号，AFAIR只有450 MHz着色器（我找不到参考ATM，但它应该绝对低于5000的时钟频率为513 MHz），这使它大约有115个GFlops FP64。与此同时，上限GTX 480约为168 GFlops FP64，甚至GTX 460约为113 GFlops（峰值）。 Quadro 4000上的FP32性能和内存带宽都低于GTX 480（86.9 vs 177.4 GB / s）！

请注意，从理论峰值性能的角度来看，GTX 480（data sheet）比Tesla C2050/2070和Quadro 6000快得多，这在大多数应用程序中得到反映。

答案 1 :(得分：7)

上面没有提到的Quadro / Tesla卡有一些小优点：

ECC内存。伴随着比特错误更少的问题，特斯拉卡和高端Quadros（5000和6000，而不是4000）都有ECC内存，这样可以降低软错误率。
插槽数量（以及一些相关的电源和散热问题）。 Quadro 4000是单槽卡。 Quadro 2000是一款单槽四分之三长卡。虽然GeForce GTX 480,470甚至460可以单精度超越Quadro 4000，但您不会在单个插槽中找到它们。这意味着如果你将它放在1U服务器机架或刀片中，或者如果你想在一台服务器上并行工作6个GPU以进行GPGPU工作，你可以做一些有趣的事情，这些都是GeForce不容易的事情。范围。如果您可以大量减少需要占用的刀片或机架空间的数量，那么每张卡的额外价格是非常值得的。所有这些都与芯片的装箱有关。

当然，这些优点对大多数人来说没有任何区别。但是，对于某些用途，它们至关重要。

答案 2 :(得分：1)

游戏玩家的优势＆＃34; GPU（GeForce GTX系列，如GTX 780）＆＃34;专业＆＃34;用于CUDA编程的GPU（Tesla系列和Quadro系列）是：

GTX具有更好的单精度性能
GTX具有更高的内存带宽
GTX 费用更少

但是

Quadro和特斯拉通常有更多记忆
Quadro和特斯拉提供更好的双精度性能
有些Quadro GPU只采用一个 PCI-E插槽而不是两个（如另一个答案所述）。

显然，GPU的选择取决于您在应用程序中的需求。但我认为对于大多数应用程序来说GTX是更好的选择。例如，在许多图像处理应用中，单精度就足够了，考虑到性能和价格，GTX显然是更好的选择。例如，在由OpenCV GPU库的主要开发人员编写的this article中，作者使用NVidia GTX 580对CPU的结果进行基准测试。如果您需要更好的双精度性能或更多内存，我会说Quadro或Tesla。

答案 3 :(得分：0)

看看规格并不明显，但我认为您对双精度的需求表明Quadro 4000更适合。虽然GeForce 480拥有更多内核和两倍的内存带宽，但它的核心是游戏卡。 Quadros的目标是专业工作，并因此得到更好的支持。此外，Quadro可以进行64倍抗锯齿（相对于GeForce的32倍）这一事实表明功能更强大的卡。