NVIDIA Tesla的单精度和双精度之间是否存在关联?

时间:2014-09-03 20:41:29

标签: gpu nvidia tesla

在特斯拉K20型号中,峰值单精度浮点性能约为3.52 TFlops但双精度为1.17 TFlops,因此比率为3.特斯拉K20X为3.95和1.31,特斯拉K40为4.29和1.43 TFlops,比例似乎重复。我的问题是,如果有一个理由比例是3而不是2,那对我来说似乎合乎逻辑,因为单精度和双精度之间的差异。我正在学习GPUS和GPGPUS,所以我不太了解它。

在这个pdf的第二页中有一个specs表。 NVIDIA-Tesla-Kepler-Family-Datasheet.pdf

1 个答案:

答案 0 :(得分:0)

您列出的模型均基于Kepler架构,其峰值双精度速率等于峰值单精度速率的1/3。这就是NVIDIA构建这款硬件的方式。相比之下,Fermi是以前的硬件产品,其峰值倍率和单精度率之间的比率为1/2。

您可以参考NVIDIA文档获取指令吞吐量,指令类型和硬件生成:

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#maximize-instruction-throughput

您会注意到,消费级产品(GeForce GTX)通常具有更低的双倍到单一精度--1 / 8,1 / 12,1 / 24甚至1/32,具体取决于硬件版本。