我是使用cusp库进行cuda的新手。我正在尝试为CUDA实现修订的单纯形算法。为此,我需要乘以2个稀疏矩阵来更新基矩阵。
所以问题是 - 如何使用cusp库来乘以2个稀疏矩阵(在什么格式下并不重要)?还有一种方法可以知道结果矩阵将包含多少非零元素(用于内存分配)?
我试过了:
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdlib.h>
#include <stdio.h>
#include "cusparse.h"
#include <cusp/version.h>
#include <cusp/multiply.h>
#include <cusp/array2d.h>
#include <cusp/print.h>
#include <cusp/coo_matrix.h>
int main(void)
{
cusp::coo_matrix<int,double,cusp::device_memory> A(2,2,2);
A.values[0] = 1;
A.row_indices[0] = 0;
A.column_indices[0]= 0;
A.values[1] = 1;
A.row_indices[1] = 1;
A.column_indices[1]= 1;
cusp::coo_matrix<int, double, cusp::device_memory> B(2,2,4);
B.values[0] = 1;
B.row_indices[0] = 0;
B.column_indices[0]= 0;
B.values[1] = 2;
B.row_indices[1] = 0;
B.column_indices[1]= 1;
B.values[2] = 3;
B.row_indices[2] = 1;
B.column_indices[2]= 0;
B.values[3] = 4;
B.row_indices[3] = 1;
B.column_indices[3]= 1;
cusp::print(A);
cusp::print(B);
cusp::coo_matrix<int,double, cusp::device_memory> C(2,2,4);
cusp::multiply(A,B,C);
cusp::print(C);
}
as cusp:multiply()是我找到的唯一乘法函数。
cusp v.0.4 CUDA v.5.5
答案 0 :(得分:1)
如何使用cusp库乘以2个稀疏矩阵(以什么格式无关紧要)?
是的,cusp::multiply
是正确的功能。您的代码可以正常使用。
还有一种方法可以知道结果矩阵将包含多少非零元素(用于内存分配)?
您不需要提前分配它。将C
矩阵的定义更改为:
cusp::coo_matrix<int,double, cusp::device_memory> C;
并且您的代码仍能正常运行。
答案 1 :(得分:0)
感谢您的回答。这段代码对我没用,但我发现了问题。出于某种原因,当我将计算能力设置为3.5而SM版本也设置为3.5时,它无法正常工作。我把它设置为2.0 / 2.1,现在工作得很好。