应用错误收集

时间：2013-05-18 12:40:59

标签： cuda

是否可以在使用相同GPU的不同上下文（CPU线程）之间共享cudaMalloc'ed GPU缓冲区？每个上下文分配一个输入缓冲区，需要由预处理内核填充，该预处理内核将使用整个GPU，然后将输出分配给它们。

此方案非常适合避免与GPU之间的多个数据传输。该应用是一个波束形成器，它将组合多个天线信号并生成多个波束，其中每个波束将由不同的GPU上下文处理。光束的整个处理管道已经到位，我只需要添加波束成形部分。让每个线程生成它自己的光束会复制输入数据，所以我想避免这种情况（同样，一次生成多个光束效率更高）。

答案 0 :(得分：4)

每个CUDA上下文都有自己的虚拟内存空间，因此您不能在另一个上下文中使用来自一个上下文的指针。

话虽如此，从CUDA 4.0开始，默认情况下每个进程创建一个上下文而不是每个线程。如果您有多个线程使用相同的CUDA上下文运行，则在线程之间共享设备指针应该没有问题。

答案 1 :(得分：-1)

我不认为多个线程可以使用相同的CUDA上下文运行。我做了实验，父cpu线程创建一个上下文然后fork一个子线程。子线程将使用父线程创建的上下文（cuCtxPushCurrent（ctx））启动内核。该程序就在那里。