CUDA - 用于PCI-E的GB / s与用于GPU的内存时钟速度的Gbps

时间:2017-02-04 11:23:33

标签: cuda gpu bandwidth pci-e

我对PCI-E 3.0的速度感到震惊:对于顶级伽马GPU的内存时钟速度,大约为16 GB / s(千兆字节/秒)(Titan X列出~10 Gbps,即每秒千兆位)

所以我们有

PCI-E 3.0    16 GB/s
Titan X      ~1 GB/s

所以问题是:为什么会出现这种糟糕的差异?他们经常说CUDA认为PCI-E是利用GPU电源的最大障碍,但似乎相反:PCI-E可以处理比GPU内存更大的负载(甚至PCI-E约为8 GB / s)

我的推理在某种程度上是否存在缺陷?

1 个答案:

答案 0 :(得分:3)

TITAN X的10 gigabit/s memory bandwidth value per-pin 。使用384位宽的存储器接口,这相当于480 GB /秒的总理论峰值存储器带宽。实际可实现的值约为理论峰值带宽的80%,对于内存和PCIe也是如此。