我有两个线程和一个使用CUDA驱动程序API的上下文,并且必须发现内存分配/自由函数的一些问题。作为旁注,一个线程在CU_PER_THREAD_STREAM
(不是遗留)中专门启动内核/ memset,而另一个线程在自定义流上启动。
一切正常,但cuMemFree
会在INVALID_VALUE
上返回CUdeviceptr
,而cuMemFree
曾是其他流中的内核参数。即使我在count($data)
之前插入完整的上下文同步。
所以我的问题是:是使多个线程使用驱动程序API 在一个上下文上分配/释放的规则。我找不到任何记录。