我对PCI-E 3.0的速度感到震惊:对于顶级伽马GPU的内存时钟速度,大约为16 GB / s(千兆字节/秒)(Titan X列出~10 Gbps,即每秒千兆位)
所以我们有
PCI-E 3.0 16 GB/s
Titan X ~1 GB/s
所以问题是:为什么会出现这种糟糕的差异?他们经常说CUDA认为PCI-E是利用GPU电源的最大障碍,但似乎相反:PCI-E可以处理比GPU内存更大的负载(甚至PCI-E约为8 GB / s)
我的推理在某种程度上是否存在缺陷?
答案 0 :(得分:3)
TITAN X的10 gigabit/s memory bandwidth value是 per-pin 。使用384位宽的存储器接口,这相当于480 GB /秒的总理论峰值存储器带宽。实际可实现的值约为理论峰值带宽的80%,对于内存和PCIe也是如此。