我正在尝试探索cblas库;所以我尝试使用Level3 cblas_sgemm 例程进行二维矩阵乘法。
C=(alpha)* A * B + (beta) * C
;; where aplha=1 & beta=0
#define TYPE float
#define A_R 3
#define A_C 2
#define B_R 2
#define B_C 3
int main()
{
TYPE *A=NULL,*B=NULL,*C=NULL;
if(A_C != B_R)
{
printf("\nA(%d,%d) X B(%d,%d) not possible\n",A_R,A_C,B_R,B_C);
exit(1);
}
A=(TYPE*)malloc(A_R*A_C*sizeof(TYPE));
B=(TYPE*)malloc(B_R*B_C*sizeof(TYPE));
C=(TYPE*)malloc(A_R*B_C*sizeof(TYPE));
initM(A,B,C);//initializes matrix
cblas_sgemm(CblasRowMajor, CblasNoTrans,CblasNoTrans,A_R, B_C,A_C, 1.0, A,A_R, B, B_R,0.0, C, A_C);
//multiply(A,B,C);
printf("\n%f\n",C[ (A_R*B_C)-1]);
}
我使用静态库编译了我的程序:
gcc mxm_blas.c -L/CBLAS/lib/ -lcblas -L/BLAS/ -lblas -I/CBLAS/include/ -lgfortran
现在运行代码,我得到:
进入SGEMM参数编号8时出现非法值
在我看来,麻烦在于声明数组的方式!大多数示例i have seen将数组声明为:
float A[100][100],b[100][100],C[100][100];
这是错误的原因还是程序错误?是不是可以通过sgemm API进行基于malloc的矩阵乘法?
UPDATE: initM初始化矩阵:
void initM(TYPE* A,TYPE* B,TYPE* C)
{
long int i,j;
j=A_R*A_C;
for(i=0;i<j;i++) A[i]=2;
j=B_R*B_C;
for(i=0;i<j;i++) B[i]=3;
j=A_R*B_C;
for(i=0;i<j;i++) C[i]=0;
}
答案 0 :(得分:1)
错误消息由sgemm
而非cblas_sgemm
生成。 sgemm
的第8个参数是:
SUBROUTINE SGEMM(TRANSA,TRANSB,M,N,K,ALPHA,A, LDA ,B,LDB,BETA,C,LDC)
C函数cblas_sgemm只是一个调用Fortran例程sgemm的包装器。基本上它会转换从by value
传递给by reference
的一些参数。此外,Fortran例程缺少“RowMajor”参数。
由于您使用的是“RowMajor”存储,因此您应该使用列数作为矩阵的主要维度。
即使我无法测试,我建议:
cblas_sgemm(CblasRowMajor, CblasNoTrans,CblasNoTrans,A_R, B_C, A_C, 1.0, A, A_C, B, B_C, 0.0, C, B_C);
此外,您可以参考GSL example。
答案 1 :(得分:1)
对ctheo的回答略有修改:
A[A_R][A_C] X B[B_R][B_C]=C[A_R][B_C] //if (A_C==B_R)
所以,在将最后一个参数设置为 LDC = B_C时,代码工作正常
cblas_sgemm(CblasRowMajor, CblasNoTrans,CblasNoTrans,A_R, B_C,A_C,1.0, A,A_C, B, B_C,0.0, C, B_C );