选择GeForce或Quadro GPU,通过TensorFlow进行机器学习

时间:2016-01-11 05:57:41

标签: machine-learning gpu gpgpu tensorflow

如果使用Quadro GPU与GeForce GPU,TensorFlow性能是否有明显差异?

e.g。它是否使用双精度操作或其他会导致GeForce卡掉落的东西?

我即将为TensorFlow购买GPU,并想知道GeForce是否可以。谢谢,感谢您的帮助

1 个答案:

答案 0 :(得分:33)

我认为GeForce TITAN很棒,并且广泛用于机器学习(ML)。在ML中,在大多数情况下单精度就足够了。

有关GTX系列(目前是GeForce 10)性能的更多细节可以在维基百科here找到。

网络上的其他来源支持此声明。这是引用from doc-ok in 2013permalink)。

  

相比之下,“入门级”700美元的Quadro 4000显着低于530美元的高端GeForce GTX 680,至少根据我使用多个Vrui应用的测量结果,以及最接近GeForce GTX 680的性能我能找到一款价格高达3660美元的Quadro 6000。

具体到ML,包括深度学习,有一个Kaggle forum discussion dedicated to this subject(2014年12月,permalink),它超越了Quadro,GeForce和特斯拉系列之间的比较:

  

Quadro GPU不适用于科学计算,特斯拉GPU也是如此。的Quadro   卡片是为加速CAD而设计的,因此它们无法帮助您   训练神经网络。它们可能只是用于此目的   很好,但这是浪费钱。

     特斯拉卡用于科学计算,但它们往往很漂亮   昂贵。好消息是特斯拉提供的许多功能   GeForce卡上的卡不是训练神经网络所必需的。

     

例如,特斯拉卡通常具有ECC内存,这很好   有但不是要求。他们也有更好的支持   双精度计算,但单精度很多   神经网络训练,它们的表现与GeForce大致相同   卡片。

     

特斯拉卡的一个有用功能是它们往往有很多   比同类GeForce显卡更多的RAM。如果,总是欢迎更多RAM   你计划训练更大的模型(或使用RAM密集型   计算如基于FFT的卷积。)

     

如果您在Quadro和GeForce之间进行选择,请务必选择   的GeForce。如果您选择特斯拉和GeForce,请选择GeForce,   除非你有很多钱并且真的可以使用额外的RAM。

注意:请注意您正在使用的平台以及默认精度。例如,here in the CUDA forums(2016年8月),一个开发者拥有两个Titan X(GeForce系列),并且没有看到任何R或Python脚本的性能提升。这被诊断为R被默认为双精度,并且在新GPU上的性能比其CPU(Xeon处理器)更差。特斯拉GPU被认为是双精度的最佳性能。在这种情况下,将所有数字转换为float32可将性能从12.437增加到nvBLAS 0.324s,并在一个TITAN X上使用gmatrix + float32s(参见第一个基准)。引用此论坛讨论:

  

Titan X的双精度性能相当低。