我写了下面的代码来计算矩阵:
vec0=repmat(vec,1,9);
triw = (bsxfun(@times,vecO(1,:)',yc1)-bsxfun(@times,vecO(2,:)',xc1)).*(bsxfun(@times,vecO(2,:)',yc1)+bsxfun(@times,vecO(1,:)',xc1));
vec
是 2 -by- 900 矩阵,xc1
和yc1
8100 -by- 900 。我在循环中使用此代码。它很慢,所以我想提高它的性能。我该怎么做?
答案 0 :(得分:2)
通过将计算重新组合为2次调用bsxfun
而不是4次,我能够将速度提高约30-40%:
triw = bsxfun(@times, prod(vec0).', yc1.^2-xc1.^2)-...
bsxfun(@times, diff(vec0.^2).', xc1.*yc1);
请注意,我还使用了array transpose operator .'
而不是complex conjugate transpose operator '
。第一个只是重新组织数组而不修改值,而第二个可以在你处理complex data时给你不同的结果。
这是我用来比较两种方法的代码:
% Random test data:
vec0 = rand(2, 8100);
xc1 = rand(8100, 900);
yc1 = rand(8100, 900);
% Define anonymous functions to test:
fcn1 = @(v, x, y) (bsxfun(@times, v(1, :).', y)-bsxfun(@times, v(2, :).', x)).*...
(bsxfun(@times, v(2, :).', y)+bsxfun(@times, v(1, :).', x));
fcn2 = @(v, x, y) bsxfun(@times, prod(v).', y.^2-x.^2)-...
bsxfun(@times, diff(v.^2).', x.*y);
% Test the mathematical accuracy:
triw1 = fcn1(vec0, xc1, yc1);
triw2 = fcn2(vec0, xc1, yc1);
max(abs(triw1(:)-triw2(:)))
ans =
4.440892098500626e-16
% Time the results:
t1 = timeit(@() fcn1(vec0, xc1, yc1))
t1 =
0.107775908242267 % seconds
t2 = timeit(@() fcn2(vec0, xc1, yc1))
t2 =
0.068403928901861 % seconds
对于双精度数字,两个结果之间的最大绝对差值为floating-point relative accuracy,因此实际上没有区别。