我正在尝试计算gtx970的理论带宽。根据以下规格: -
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-970/specifications
内存时钟为7Gb / s 内存总线宽度= 256
带宽= 7 * 256 * 2/8(* 2因为它是DDR)
= 448 GB/s
然而,在规格中,它被给出为224GB / s
为什么会出现因素2的差异?如果我犯了错误,请纠正我。
由于
答案 0 :(得分:1)
7 Gbps似乎是有效时钟,即包括数据速率。另请注意,此Wikipedia list的字段解释说“所有DDR / GDDR存储器的工作频率只有此频率的一半,但GDDR5除外,它工作频率的四分之一”,这表明尽管有DDR缩写,但所有GDDR5芯片实际上都是四倍数据速率。
最后,让我指出Wikipedia中的这一说明,该说明取消了琐碎effective clock * bus width
公式的资格:
为了访问其内存,GTX 970在其8个32位物理内存通道中的7个上以196 GB / s的速率对数据进行条带化。它的最后1/8内存(4 GiB卡上的0.5 GiB)是以28 GB / s的非交错单独32位连接访问的,是其余内存空间的七分之一。因为这个较小的内存池使用与第7个通道相同的连接到较大的主池,所以它会争用对较大块的访问,从而减少有效内存带宽,而不是作为独立连接添加它。
答案 1 :(得分:0)
报告的时钟频率是“有效”时钟速率,并且已经考虑了上升沿和下降沿的传输。 DDR的问题是2倍。
关于devtalk的一些讨论:https://devtalk.nvidia.com/default/topic/995384/theoretical-bandwidth-vs-effective-bandwidth/
答案 2 :(得分:-1)
实际上,您的格式正确,但是内存时钟错误。 GeForce GTX 970的内存时钟为1753MHz(指https://www.techpowerup.com/gpu-specs/geforce-gtx-970.c2620)。