矩阵大小164986x164986 我曾尝试将CSR格式转换为密集格式,以使用Cublas方式进行Lu分解来解决。
有没有办法通过使用Cuda上的CSR值在gpu上进行Lu分解?
我已经在cusolver中尝试了Cholskey Qr方法。.我正在寻找使用lu解决问题的方法。
错误: 警告:表达式[-Woverflow]中的整数溢出 CHECK_CUDA(cudaMalloc(&d_A,A_num_rows * A_num_rows * sizeof(double)));
警告:表达式[-Woverflow]中的整数溢出 double * h_A =(double *)malloc(A_num_rows * A_num_cols * sizeof(double));
警告:表达式[-Woverflow]中的整数溢出 CHECK_CUDA(cudaMemcpy(h_A,d_A,A_num_rows * A_num_cols * sizeof(double),cudaMemcpyDeviceToHost));