与CUDA硬件Quadro 4000 Vs的区别GeForce 480

时间:2010-09-15 20:23:36

标签: hardware cuda

我正在构建一个工作站,并希望进入一些繁重的CUDA编程。我不想全力以赴地获得特斯拉卡,并且几乎将其缩小到Quadro 4000和GeForce 480,但我真的不明白它的区别,在纸面上它看起来480有更多的核心对于4000而言,480比256,但是4000的价格几乎是480的两倍。有人理解这里的差异来证明更高的价格。

我将对它进行科学计算,因此如果它们之间存在差异,那么一切都将是双精度的。

4 个答案:

答案 0 :(得分:36)

如果您既不关心可视化也不关心渲染(在屏幕上绘制最终结果,例如光线追踪),那么问题的答案会稍微简单一些,但不是一件容易的事。

我不打算详细介绍Quadro和GeForce显卡之间的差异,但我会强调一下有助于在它们之间进行选择的重点。

一般来说:

  1. 如果你需要大量内存而不是需要特斯拉或Quadro。消费卡ATM最大1.5 Gb(GTX 480),而Teslas和Quadros最大6 Gb。

  2. GF10x系列显卡的双精度(FP64)性能上限为单精度(FP32)性能的1/8,而体系结构则为1/2。另一个市场细分技巧,现在在硬件制造商中非常流行。使GeForce系列瘫痪的目的是让特斯拉系列产品在HPC中占据优势; GTX 480实际上比特斯拉20x0更快 - 1.34TFlops对1.03 TFlops,177.4 Gb对144 Gb / sec(峰值)。

  3. 特斯拉和Quadro(应该是)进行了更彻底的测试,因此不太容易产生与游戏无关的错误,但是当涉及到科学计算时,只需一次翻转就会破坏结果。 NVIDIA声称特斯拉卡是QC-d,可全天候使用。

    最近的一篇论文(Haque and Pande, Hard Data on Soft Errors: A Large-Scale Assessment of Real-World Error Rates in GPGPU)表明,特斯拉确实不易出错。

  4. 我的经验是,GeForce显卡的可靠性往往较低,特别是在高负荷下。适当的散热非常重要,同时避免使用超频卡,包括工厂过度模型(参见previously mentioned paper的图1)。

  5. 所以作为经验法则:

    • for development GeForce (除非您绝对需要> 1.5 Gb内存)
    • 用于生产HPC /科学计算

      • 特斯拉:如果您需要大量内存或FP64(+可靠性?)
      • Quadro 如果需要FP64和/或还需要高级渲染功能(新的“Fermi”Teslas具有与GeForce类似的渲染功能)

        如果您想密集使用FP64,请忘记GeForce,否则

      • **非工厂超频* GeForce *:省钱;)

    回到你问题的具体细节:

    你提到的两张牌来自完全不同的联赛,因此无法直接比较。如果您需要,Quadro的渲染功能将获得Quadro。否则,Quadro并不值得,特别是4000不比GTX 460慢,而且价格要高出3.5倍。我认为你最好使用GTX 470或480,只需确保购买标准频率的产品。

    请注意,在此比较中,瘫痪的GeForce双精度性能不是问题,但让我详细说明。由于Quadro 4000是一款低端型号,AFAIR只有450 MHz着色器(我找不到参考ATM,但它应该绝对低于5000的时钟频率为513 MHz),这使它大约有115个GFlops FP64。与此同时,上限GTX 480约为168 GFlops FP64,甚至GTX 460约为113 GFlops(峰值)。 Quadro 4000上的FP32性能和内存带宽都低于GTX 480(86.9 vs 177.4 GB / s)!

    请注意,从理论峰值性能的角度来看,GTX 480(data sheet)比Tesla C2050/2070Quadro 6000快得多,这在大多数应用程序中得到反映。

答案 1 :(得分:7)

上面没有提到的Quadro / Tesla卡有一些小优点:

  • ECC内存。伴随着比特错误更少的问题,特斯拉卡和高端Quadros(5000和6000,而不是4000)都有ECC内存,这样可以降低软错误率。
  • 插槽数量(以及一些相关的电源和散热问题)。 Quadro 4000是单槽卡。 Quadro 2000是一款单槽四分之三长卡。虽然GeForce GTX 480,470甚至460可以单精度超越Quadro 4000,但您不会在单个插槽中找到它们。这意味着如果你将它放在1U服务器机架或刀片中,或者如果你想在一台服务器上并行工作6个GPU以进行GPGPU工作,你可以做一些有趣的事情,这些都是GeForce不容易的事情。范围。如果您可以大量减少需要占用的刀片或机架空间的数量,那么每张卡的额外价格是非常值得的。所有这些都与芯片的装箱有关。

当然,这些优点对大多数人来说没有任何区别。但是,对于某些用途,它们至关重要。

答案 2 :(得分:1)

游戏玩家的优势" GPU(GeForce GTX系列,如GTX 780)"专业"用于CUDA编程的GPU(Tesla系列和Quadro系列)是:

  • GTX具有更好的单精度性能
  • GTX具有更高的内存带宽
  • GTX 费用更少

但是

  • Quadro和特斯拉通常有更多记忆
  • Quadro和特斯拉提供更好的双精度性能
  • 有些Quadro GPU只采用一个 PCI-E插槽而不是两个(如另一个答案所述)。

显然,GPU的选择取决于您在应用程序中的需求。但我认为对于大多数应用程序来说GTX是更好的选择。例如,在许多图像处理应用中,单精度就足够了,考虑到性能和价格,GTX显然是更好的选择。例如,在由OpenCV GPU库的主要开发人员编写的this article中,作者使用NVidia GTX 580对CPU的结果进行基准测试。如果您需要更好的双精度性能或更多内存,我会说Quadro或Tesla。

答案 3 :(得分:0)

看看规格并不明显,但我认为您对双精度的需求表明Quadro 4000更适合。虽然GeForce 480拥有更多内核和两倍的内存带宽,但它的核心是游戏卡。 Quadros的目标是专业工作,并因此得到更好的支持。此外,Quadro可以进行64倍抗锯齿(相对于GeForce的32倍)这一事实表明功能更强大的卡。