在CUDA的互操作区域内使用openACC指令

时间:2018-03-02 22:47:10

标签: gpu openacc cufft

有没有办法在下面的计算区域中进一步并行化循环,取代#pragma acc循环指令由PGI 18.1加载

#pragma acc host_data use_device(ptr)
    {
     cufftPlanMany( &plan, rank, ss  , &inembed, istride, idist, &onembed, ostride, odist, CUFFT_Z2Z, F.length[0]);
    // this loop
    for(int i=0;i<length[2];i++)
    {
     cufftExecZ2Z( plan, (cufftDoubleComplex *)(ptr+i*length[0]*length[1]), (cufftDoubleComplex *)(ptr+i*length[0]*length[1]), CUFFT_INVERSE );
    }
     cufftDestroy(plan);
    }

cuda计划很多人已经解决了这个问题吗?

1 个答案:

答案 0 :(得分:0)

我认为,假设袖口使用GPU的全部计算能力,进一步并行化甚至可能没有意义,