是否有可能通过例如加速大型稀疏矩阵计算。最佳地放置parantheses?
我要问的是:我可以通过强制Matlab以指定顺序执行操作来加速以下代码(例如“从右到左”或类似的东西)?
我有一个稀疏的方形对称矩阵H,它先前已被分解,还有一个稀疏向量M,其长度等于H的维数。我想做的是以下内容:
编辑:一些其他信息:H通常为4000x4000。 z和c的计算大约进行了4000次,而dVa和dVaComp的计算每4000次循环进行10次,总计40000次。 (dVa和dVaComp迭代求解,其中P_mis被更新)。
这里M*c*M'
将成为具有4个非零元素的稀疏矩阵。在Matlab中:
[L U P] = lu(H); % H is sparse (thus also L, U and P)
% for i = 1:4000 % Just to illustrate
M = sparse([bf bt],1,[1 -1],n,1); % Sparse vector with two non-zero elements in bt and bf
z = -M'*(U \ (L \ (P * M))); % M^t*H^-1*M = a scalar
c = (1/dyp + z)^-1; % dyp is a scalar
% while (iterations < 10 && ~=converged)
dVa = - (U \ (L \ (P * P_mis)));
dVaComp = (U \ (L \ (P * M * c * M' * dVa)));
% Update P_mis etc.
% end while
% end for
并且为了记录:尽管我多次使用H的倒数,但预先计算它并不快。
谢谢=)
答案 0 :(得分:1)
在对(稀疏)矩阵lu
进行分解时,您可能想尝试使用H
的扩展语法:
[L,U,P,Q] = lu(H);
额外排列矩阵Q
重新排序列以增加因子L,U
的稀疏性(而排列矩阵P
仅重新排序行以进行部分旋转)。
具体结果取决于H
的稀疏模式,但在许多情况下使用良好的列排列显着会减少因子分解中的非零数量,从而减少内存使用并增加速度。
您可以详细了解lu
语法here。
答案 1 :(得分:1)
有些事情对我来说并不完全清楚:
M = sparse([t f],[1 -1],1,n,1);
不能正确;你在行t,f
和列1,-1
上说的应该是1
;专栏-1
显然不对。dVaComp
是一个完整的矩阵,因为乘以P_mis
,而你说它应该是稀疏的。暂时搁置这些问题,我看到了一些小优化:
inv(H)*M
两次,因此您可以预先计算它。dVa
的否定可以移出循环。 dVa
,请将分配遗漏给变量。 c
的计算)。 实施更改,并尝试公平比较(我只使用了40次迭代以保持总时间很短):
%% initialize
clc
N = 4000;
% H is sparse, square, symmetric
H = tril(rand(N));
H(H<0.5) = 0; % roughly half is empty
H = sparse(H+H.');
% M is sparse vector with two non-zero elements.
M = sparse([1 N],[1 1],1, N,1);
% dyp is some scalar
dyp = rand;
% P_mis = full vector
P_mis = rand(N,1);
%% original method
[L, U, P] = lu(H);
tic
for ii = 1:40
z = -M'*(U \ (L \ (P*M)));
c = (1/dyp + z)^-1;
for jj = 1:10
dVa = -(U \ (L \ (P*P_mis)));
dVaComp = (U \ (L \ (P*M * c * M' * dVa)));
end
end
toc
%% new method I
[L,U,P,Q] = lu(H);
tic
for ii = 1:40
invH_M = U\(L\(P*M));
z = -M.'*invH_M;
c = -1/(1/dyp + z);
for jj = 1:10
dVaComp = c * (invH_M*M.') * ( U\(L\(P*P_mis)) );
end
end
toc
这给出了以下结果:
Elapsed time is 60.384734 seconds. % your original method
Elapsed time is 33.074448 seconds. % new method