标签: opencl
据我所知,CUDA有一个流功能。它使内存传输和内核执行可以在同一个中运行。当然,内存传输和内核执行中的数据不同。我可以用OpenCL做这件事。当你对视频进行一些处理时,有时会这样做。瓶颈是记忆运输。
答案 0 :(得分:2)
是的,您可以在OpenCL中重叠内存操作和内核执行。只需将blocking_read函数的clEnqueueReadBUffer参数设置为CL_FALSE即可。但是,在操作数据之前,您需要确保传输已完成。使用事件。
blocking_read
clEnqueueReadBUffer
CL_FALSE