cuSolverRf样本状态分配失败

时间:2016-08-22 08:11:10

标签: cuda malloc cusolver

使用示例.mtx文件lap2D_5pt_n100.mtxlap3D_7pt_n20.mtx运行CuSolverRf sample,可让程序顺利运行。但是,当我插入自己的.mtx文件时,我在第8步之后收到错误:

  

“cuSolverRF.ccp上的CUDA错误:649代码= 2 ......”

我已将问题缩小到这里:

checkCudaErrors(cusolverRfSetupHost(
    rowsA, nnzA, 
    h_csrRowPtrA, h_csrColIndA, h_csrValA,
    nnzL, 
    h_csrRowPtrL, h_csrColIndL, h_csrValL, 
    nnzU, 
    h_csrRowPtrU, h_csrColIndU, h_csrValU, 
    h_P, 
    h_Q, 
    cusolverRfH));

哪个会跳转到

    void check(T result, char const *const func, const char *const file, int const line)
{
    if (result)
    {
        fprintf(stderr, "CUDA error at %s:%d code=%d(%s) \"%s\" \n",
                file, line, static_cast<unsigned int>(result), _cudaGetErrorEnum(result), func);
        DEVICE_RESET
        // Make sure we call CUDA Device Reset before exiting
        exit(EXIT_FAILURE);
    }
}

我的问题是“结果”是如何产生的?我能做些什么来克服这个问题或者我做错了什么?

附加信息:我的矩阵是196530到196530,2530798 nnz。

1 个答案:

答案 0 :(得分:2)

错误代码2对应CUSOLVER_STATUS_ALLOC_FAILED

quoting the cuSOLVER documentation:

  

cuSolver库中的资源分配失败。这是   通常由cudaMalloc()失败引起。   要纠正:在函数调用之前,先解除分配   尽可能多地分配内存。

这意味着无法分配矩阵的内存,可能是因为超出了GPU的内存。尝试释放内存(如文档中所述),使用较小的输入矩阵,或使用具有更多内存的GPU。