如何从内存时钟/内存速度获取内存带宽

时间:2013-02-24 19:49:18

标签: gpu memory-bandwidth

仅供参考,以下是我从Nvidia获得的规格

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications

请注意,内存速度/内存时钟在其网站上是相同的,并且都以Gbps为单位。

谢谢!

3 个答案:

答案 0 :(得分:22)

Titan有384bit总线,而GTX 680只有256,因此内存带宽增加50%(假设时钟和延迟相同。

编辑:我将尝试更多地解释整个概念:以下是决定RAM性能的因素的简化模型(不仅仅是在显卡上)。 / p>

因素A:频率

RAM以时钟速度运行。运行频率为1 GHz的RAM“每秒”嘀嗒“1,000,000,000(十亿次)。每次打勾,它都可以在每个车道上接收或发送一位。因此,只有一个内存通道以1GHz运行的理论RAM模块每秒可传输1千兆位,因为字节数为8位,即每秒125兆字节。

因素B:“抽水率”

DDR-RAM(双倍数据速率)每个刻度可以提供两位,甚至还有“四泵”总线,每个刻度提供四位,但我还没有听说过后者用于显卡。

因素C:总线宽度。

RAM不只有一个单一的通道来发送数据。甚至英特尔4004都有一个4位总线。您链接的显卡分别有256条总线通道和384条总线通道。

所有上述因素相乘以计算可以发送或接收数据的理论最大值:

**最大吞吐量(以每秒字节数为单位)=频率* Pumprate * BusWidth / 8 **

现在让我们对您链接的两个显卡进行数学计算。它们似乎都使用相同类型的RAM(GDDR5,泵速为2),均以3 GHz运行。

GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s

GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s

因素D:延迟 - 或现实开始

这个因素比上述所有组合难以计算。基本上,当你告诉你的RAM“嘿,我想要这个数据”时,需要一段时间才能找到答案。这种延迟取决于许多事情并且很难计算,并且通常导致RAM系统提供的方式低于其理论最大值。这是所有时间,预取和大量其他东西进入图片的地方。由于不仅可以用于营销的数字,更高的数字转化为“更好”,营销重点主要在于其他东西。如果您想知道,这主要是GDDR5与您在主板上的DDR3不同的地方。

答案 1 :(得分:0)

我认为正确的计算在这里解释:
https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

简而言之:
"(内存时钟x总线宽度/ 8)* GDDR类型乘数=带宽(GB / s)

GDDR3的GDDR类型乘数为2,GDDR5为4。"

那里有更多细节,很好地解释和详细。

答案 2 :(得分:0)

来自https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/

memory clock in Hz×bus width÷8)×memory clock type multiplier =带宽,以MB / s为单位

其中memory clock type multiplier是以下之一:

HBM1 / HBM2:2
GDDR3:2
GDDR5:4
GDDR5X:8

在撰写本文时,让我们采用目前最先进的显卡之一GTX 1080 Ti,它使用GDDR5X内存。根据{{​​3}},此卡的规格如下:

内存时钟:1376MHz
总线宽度:352位
内存类型:GDDR5X

如果我们将这些值插入上面的公式中,我们得到:

(1376 * 352/8)* 8 = 484 352 MB / s = ~484 GB / s

与使用较旧GDDR5内存的techPowerUp!类似:

内存时钟:2002MHz
总线宽度:256位
内存类型:GDDR5

(2002 * 256/8)* 4 = 256 256 MB / s = ~256 GB / s

最后,对于使用HBM1的AMD Fury X:

内存时钟:500MHz
总线宽度:4096位
内存类型:HBM1

(500 * 4096/8)* 2 = 512 000 MB / s = 512 GB / s

和使用HBM2的GTX 1070

内存时钟:945MHz
总线宽度:2048位
内存类型:HBM2

(945 * 2048/8)* 2 = 483 840 MB / s = ~484 GB / s