标签: parallel-processing c++-amp
虽然多个流可以允许在CUDA中同时进行数据传输和内核执行,但我不清楚它是否在C ++ AMP中得到支持。
我想要做的是从设备读回缓冲区(我确实需要主机上的数据),而内核正在将数据填充到另一个缓冲区,然后用两个缓冲区进行触发。
这个用例是否支持C ++ AMP?