Question

我在vs2010上编译cuda 5.5项目。我需要使用mpir库，因为我的项目包含大量数据。当我使用mpir指令时出现此错误。我不知道如何解决它。该程序使用mpir函数添加数组A和数组B.

 __global__
void vecAdd(mpz_t *A,mpz_t *B,mpz_t *C,int N)
{
    int i = threadIdx.x + blockDim.x * blockIdx.x;
    if(i<N)
    mpz_add(C[i],A[i],B[i]); 
}

int main()
{
    mpz_t *h_A;
    h_A=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(h_A[0],5,16);
    mpz_set_si(h_A[0],1);
    mpz_set_si(h_A[1],2);
    mpz_set_si(h_A[2],3);
    mpz_set_si(h_A[3],4);
    mpz_set_si(h_A[4],5);

    mpz_t *h_B;
    h_B=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(h_B[0],5,16);
    mpz_set_si(h_B[0],1);
    mpz_set_si(h_B[1],2);
    mpz_set_si(h_B[2],3);
    mpz_set_si(h_B[3],4);
    mpz_set_si(h_B[4],5);
    mpz_t *h_C;
    h_C=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(h_C[0],5,16);

    int N=5;
    int size=N*sizeof(mpz_t);

    mpz_t *d_A;
    d_A=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(d_A[0],5,16);

    mpz_t *d_B;
    d_B=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(d_B[0],5,16);

    mpz_t *d_C;
    d_C=(mpz_t*)malloc(5*sizeof(mpz_t));
    mpz_array_init(d_C[0],5,16);

    cudaMalloc((void**)&d_A,size);
    cudaMemcpy(d_A, h_A, size, cudaMemcpyHostToDevice);
    cudaMalloc((void**)&d_B,size);
    cudaMemcpy(d_B, h_B, size, cudaMemcpyHostToDevice);
    cudaMalloc((void**)&d_C,size);

    vecAdd<<<ceil(N/512.0),512>>>(d_A,d_B,d_C,N);

    cudaMemcpy(h_C, d_C, size, cudaMemcpyDeviceToHost);

    cudaFree(d_A);  
    cudaFree(d_B);  
    cudaFree(d_C);

    for(int i=0;i<5;i++)
    {
       mpz_out_str(stdout,10,h_C[i]);
       printf("\n");
    }

    return 0;
}

Answer 1

您必须了解可能从设备调用的函数必须编译为设备代码。在函数声明中放置__device__将使其在设备端可用。

但是，由于mpz_add来自MPIR库，而不是使用CUDA兼容功能（据我所知），你运气不好。我建议你找到一个任意精度数字的GPU实现。

不允许从全局函数调用主机函数

1 个答案: