cuda - 双精度和全精度浮动之间的差异

时间：2011-09-10 15:59:10

标签： cuda double precision

我正在研究一种可能的基于gpu的teraflop计算机...... 使用的基准是LINPACK 现在是问题所在;通过linpack文档，它说它以全精度而不是双精度计算，对于某些机器，全精度可以是单精度。有人可以对差异有所了解，因为这将决定我是应该选择GTX 590s还是特斯拉2070s。

答案 0 :(得分：2)

我认为术语“全精度”被选择用于涵盖IEEE-754双精度（这是所提到的GPU上使用的）和老Cray矢量计算机的“单精度”格式，其中有1个符号位，15个指数位和48个尾数位，提供比IEEE-754双精度更大的范围但精度稍低。以下是Cray-1上使用的浮点格式的文档：

答案 1 :(得分：0)

关于官方nVidia的HPL版本0.8（这是我们用来对我们的混合机器进行基准测试）：

它只能在Teslas上运行（只有当你的GPU有超过2 GiB的内存时才能运行，据我所知，这只适用于特斯拉）

它使用双精度，因此使用Teslas的另一点，因为双重算术性能仅限于主流GPU。

BTW：在6节点机器上实现至少50％的效率（每个节点2个GPU）几乎不可能。