我目前没有费米,但目标平台是特斯拉/费米,我想问的问题是费米是否支持Open MP这样:
#pragma omp parallel for num_threads(N)
for (int i=0; i<1000; ++i)
{
int threadID=omp_get_thread_num();
cudafunctions<<<blocks, threads, 1024, streams[threadID]>>>(input+i*colsizeofinput);
}//where there are N streams created.
答案 0 :(得分:1)
是的,类似于is possible。尝试将多个内核启动到同一设备(超出流提供的内容)时,OpenMP不提供任何特定的好处,并且如果这是您的意图,则不需要实现内核的并发执行。
使用CUDA的OpenMP的典型用例是to manage multiple devices。