我正在研究一种可能的基于gpu的teraflop计算机...... 使用的基准是LINPACK 现在是问题所在;通过linpack文档,它说它以全精度而不是双精度计算,对于某些机器,全精度可以是单精度。有人可以对差异有所了解,因为这将决定我是应该选择GTX 590s还是特斯拉2070s。
答案 0 :(得分:2)
我认为术语“全精度”被选择用于涵盖IEEE-754双精度(这是所提到的GPU上使用的)和老Cray矢量计算机的“单精度”格式,其中有1个符号位,15个指数位和48个尾数位,提供比IEEE-754双精度更大的范围但精度稍低。以下是Cray-1上使用的浮点格式的文档:
http://ed-thelen.org/comp-hist/CRAY-1-HardRefMan/CRAY-1-HRM.html#p3-20
答案 1 :(得分:0)
关于官方nVidia的HPL版本0.8(这是我们用来对我们的混合机器进行基准测试):
它只能在Teslas上运行(只有当你的GPU有超过2 GiB的内存时才能运行,据我所知,这只适用于特斯拉)
它使用双精度,因此使用Teslas的另一点,因为双重算术性能仅限于主流GPU。
BTW:在6节点机器上实现至少50%的效率(每个节点2个GPU)几乎不可能。