cudaDeviceProp :: asyncEngineCount的返回值是什么意思?

时间:2014-11-26 21:25:26

标签: asynchronous cuda

我已经阅读了文档,它说如果它返回1: device can concurrently copy memory between host and device while executing a kernel

如果是2: device can concurrently copy memory between host and device in both directions and execute a kernel at the same time

究竟有什么区别?

1 个答案:

答案 0 :(得分:4)

使用1个DMA引擎,设备可以从CPU下载数据或将数据上传到CPU,但不能同时执行。使用2个DMA引擎,该设备可以并行执行。

无论可用的DMA引擎数量多少,该设备还有一个执行引擎,可以与正在进行的内存操作并行运行内核。