我正在尝试使用Intel MKL计算存储在SELECT ?country ?countryLabel ?population WHERE {
?country wdt:P31 wd:Q6256.
?country wdt:P17 wd:Q142.
?country wdt:P1082 ?population.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
布局中的矩阵的伪逆。
LAPACK_ROW_MAJOR
我正在使用A_5x4 =
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16
17 18 19 20
函数来计算SVD的紧凑形式:
gesvd
其中info = LAPACKE_dgesvd(LAPACK_ROW_MAJOR, 'S', 'S', m, n, A, lda, s, u, ldu, vt, ldvt, superb);
,m=5
,n=4
,lda=4
,ldu=5
。我可以成功使用MKL函数获取矩阵ldvt=4
的SVD:
A = U*S*VT
由于u_5x4 =
0.0965 0.7686 0.6323 0.0034
0.2455 0.4896 -0.6208 0.0412
0.3945 0.2107 -0.3285 -0.4681
0.5435 -0.0683 -0.0097 0.7989
0.6924 -0.3472 0.3267 -0.3754
s_4x1 =
53.520222
2.363426
0.000000
0.000000
vt_4x4 =
0.4430 0.4799 0.5167 0.5536
-0.7097 -0.2640 0.1816 0.6273
0.0912 -0.5242 0.7747 -0.3417
0.5401 -0.6521 -0.3160 0.4280
只有两个非零元素,因此我需要将s
的前两列和u
的两列(不是v
)视为以及vt
s
我可以毫无问题地使用v_4x2_needed_for_pinv =
0.4430 0.4799
-0.7097 -0.2640
0.0912 -0.5242
0.5401 -0.6521
u_2x5_needed_for_pinv =
0.0965 0.2455 0.3945 0.5435 0.6924
0.7686 0.4896 0.2107 -0.0683 -0.3472
进行矩阵乘法并计算A的伪逆。但是,我对使用for-loop
和dscal
非常感兴趣,这主要是因为实际矩阵的要计算的逆数非常大。
我能够成功地使用cblas_dgemm
找出问题,并将V的前两列乘以S的倒数:
dscal
我的问题是执行MKL_INT k = ((m) < (n) ? (m) : (n));
// Computing VT = vt*(s^-1)
MKL_INT incx = 1;
MKL_INT r = 0;
for (int i = 0; i < k; i++)
{
double ss;
if (s[i] > 1.0e-9)
{
ss = 1.0 / s[i];
r++;
}
else
ss = s[i];
dscal(&n, &ss, &vt[i*n], &incx); // this replaces vt with new values.
}
与v_4x2_needed_for_pinv
的矩阵乘法,u_2x5_needed_for_pinv
是u
已计算的vt
和LAPACKE_dgesvd
数组的子集。有人可以帮我弄清楚如何使用cblas_dgemm
吗?我会很感激的。
我尝试了以下操作,该函数的输入对我来说很有意义,但不起作用
// inv(A) = VT^T * U^T = V * U^T
double* inva = (double*)malloc(n*m * sizeof(double));
double alpha = 1.0, beta = 0.0;
MKL_INT ld_inva = n;
cblas_dgemm(CblasRowMajor, CblasTrans, CblasTrans, n, m, r, alpha, vt, n, u, m, beta, inva, ld_inva);
其中r=2
是因为s
仅具有两个非零元素(53.520222
和2.363426
)。
答案 0 :(得分:0)
由于最后三个奇异值为零,因此可以说SVD产生:
u(5,2)
与ldu=4
vt(2,4)
与ldvt=4
invA(5,4)
逆计算为 invA = vt ^ T * invS * u ^ T 然后您的循环可以转换为 invA =(invS * vt)^ T * u ^ T
MKL_INT ma = mu = 5;
MKL_INT na = nvt = 4;
MKL_INT nu = mvt = ms = 2;
MKL_INT lda = ldu = ldvt = 4;
// vt = (invS * vt)
for(MKL_INT i=0; i<ms; i++){
cblas_dscal (nvt, s[i], vt+(i*ldvt), 1);
}
// invA = vt^T * u^T
cblas_dgemm (CblasRowMajor, CblasTrans, CblasTrans, ma, na, nu, 1.0, vt, ldvt, u, ldu, 0.0, invA, lda);