我无法利用CBLAS执行外部产品。我的代码如下:
//===SET UP===//
double x1[] = {1,2,3,4};
double x2[] = {1,2,3};
int dx1 = 4;
int dx2 = 3;
double X[dx1 * dx2];
for (int i = 0; i < (dx1*dx2); i++) {X[i] = 0.0;}
//===DO THE OUTER PRODUCT===//
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasTrans, dx1, dx2, 1, 1.0, x1, dx1, x2, 1, 0.0, X, dx1);
//===PRINT THE RESULTS===//
printf("\nMatrix X (%d x %d) = x1 (*) x2 is:\n", dx1, dx2);
for (i=0; i<4; i++) {
for (j=0; j<3; j++) {
printf ("%lf ", X[j+i*3]);
}
printf ("\n");
}
我明白了:
Matrix X (4 x 3) = x1 (*) x2 is:
1.000000 2.000000 3.000000
0.000000 -1.000000 -2.000000
-3.000000 0.000000 7.000000
14.000000 21.000000 0.000000
但是这里找到了正确的答案: https://www.sharcnet.ca/help/index.php/BLAS_and_CBLAS_Usage_and_Examples
我见过:Efficient computation of kronecker products in C
但是,它并没有帮助我,因为他们实际上并没有说如何利用dgemm实际做到这一点......
有任何帮助吗?我在这里做错了什么?
答案 0 :(得分:7)
你可以用dgemm做到这一点,但是使用dger会更加风格化,这是一个专门的外部产品实现。因此,它更容易正确使用:
cblas_dger(CblasRowMajor, /* you’re using row-major storage */
dx1, /* the matrix X has dx1 rows ... */
dx2, /* ... and dx2 columns. */
1.0, /* scale factor to apply to x1x2' */
x1,
1, /* stride between elements of x1. */
x2,
1, /* stride between elements of x2. */
X,
dx2); /* leading dimension of matrix X. */
dgemm 具有很好的功能,即传递\beta = 0
为您初始化结果矩阵,这使您无需在调用之前自己将其显式归零。 @Artem Shinkarov的回答提供了如何使用dgemm的很好的描述。
答案 1 :(得分:4)
接口在BLAS中不是很方便,但是,让我们试着搞清楚。首先,让我们说我们所有的矩阵都在RowMajor中。现在我们有以下设置
row col
x1: dx1 1 (A)
x2: 1 dx2 (B)
X: dx1 dx2 (C)
现在,我们只需要根据
指定的文档填写调用C = \alpha A*B + \beta C
所以我们得到:
cblas_dgemm (CblasRowMajor, CblasNoTrans, CblasNoTrans,
(int)dx1, /* rows in A */
(int)dx2, /* columns in B */
(int)1, /* columns in A */
1.0, x1, /* \alpha, A itself */
(int)1, /* Colums in A */
x2, /* B itself */
(int)dx2, /* Columns in B */
0.0, X, /* \beta, C itself */
(int)dx2 /* Columns in C */);
这应该做我希望的工作。 以下是dgemm参数的说明:Link