应用错误收集

CUDA：HtoD和DtoH带宽之间的差异

时间：2011-08-11 17:01:12

标签： cuda bandwidth

另一个与带宽相关的问题。我预计设备到主机带宽和主机到设备的带宽相似，但我发现两者之间存在显着差异。考虑到两个遵循相同的路线，所以有效带宽应该是相同的，不是吗？测试平台由两个插座上的12个Intel Westmere CPU，4个Tesla C2050 GPU和4个PCIe Gen2 Express插槽组成。使用NVidia代码示例中的bandwidthtest程序。 enter image description here

从主机到设备执行cudamemCpy的开销是多少？

1 个答案:

答案 0 :(得分：2)

首先，我会说这两条曲线相似。我可以诚实地说，我从未在我使用过的任何系统上看到过对称的PCI-e带宽 - 包括CUDA和图形（OpenGL / D3D）测试，所以我认为不是这样（特别是这个小差异））应该关注你。

与您的其他PCI-e带宽问题一样，答案类似 - 驱动程序可能针对不同类型和大小的传输使用不同的策略，尝试获得尽可能高的吞吐量。

实际吞吐量取决于许多因素，包括GPU的类型，以及正在使用的主机芯片组上的尤其。