在详细信息选项卡下的visual profiler(cuda toolkit 4.1)中,有一个称为吞吐量的指标。这对memcpy HtoD DtoH等有价值。有谁知道它究竟是什么? 帮助搜索提供了许多不同的吞吐量(例如全局内存吞吐量等),我无法确定此度量标准所指的位置。
答案 0 :(得分:2)
吞吐量是数据传输速率,通常以GB / s为单位。对于HtoD和DtoH,这是主机和设备之间通过PCI总线连接两者的数据传输。您也可以使用DtoD,在这种情况下,您的吞吐量应该要高得多,因为您不受PCI总线带宽的限制。这是一个重要的指标,因为在主机和设备之间传输数据是CUDA良好性能的最大瓶颈之一。您可以尽可能在主机上使用固定(页锁定)内存来提高主机设备吞吐量。
您可以使用nvvp
对SDK中包含的bandwidthTest
示例进行概要分析来对此进行测试。