CUDA:主机到设备的带宽大于PCIe的峰值b / w?

时间:2011-08-11 04:09:37

标签: cuda bandwidth

我使用了相同的情节作为另一个问题。可以看出峰值带宽超过5.5GB / s。我正在使用代码示例中的NVidia带宽测试程序来查找主机到设备之间的带宽,反之亦然。 该系统由两个插座上的12个Intel Westmere CPU,4个Tesla C2050 GPU和4个PCIe Gen2 Express插槽组成。现在的问题是,由于PCIe x16 Gen2的峰值带宽在一个方向上是4GB / s,为什么我在进行主机到设备传输时获得更多带宽?enter image description here

我想到每个PCIe都通过I / O控制器集线器连接到CPU,I / O控制器集线器通过QPI(更多b / w)连接到CPU。

1 个答案:

答案 0 :(得分:6)

每个方向的PCIe x16 Gen2的峰值带宽 8GB / s 。你没有超过峰值。