标签: c++ linux opencl nvidia gpgpu
在许多旧的nVidia卡上使用OpenCL时,对clEnqueueNDRangeKernel(...)的调用在计算完成之前不会返回。请参阅:clEnqueueNDRange blocking on Nvidia hardware? (Also Multi-GPU)。
OpenCL标准意味着clEnqueueNDRangeKernel(...)应该是异步的,并且在使用OpenCL的AMD和Intel实现时,它实际上是一个非阻塞函数。
这是否已在更现代的nVidia GPGPU上修复?