Question

我写了下面的代码来计算矩阵：

 vec0=repmat(vec,1,9);
 triw = (bsxfun(@times,vecO(1,:)',yc1)-bsxfun(@times,vecO(2,:)',xc1)).*(bsxfun(@times,vecO(2,:)',yc1)+bsxfun(@times,vecO(1,:)',xc1));

vec是 2 -by- 900 矩阵，xc1和yc1 8100 -by- 900 。我在循环中使用此代码。它很慢，所以我想提高它的性能。我该怎么做？

Answer 1

通过将计算重新组合为2次调用bsxfun而不是4次，我能够将速度提高约30-40％：

triw = bsxfun(@times, prod(vec0).', yc1.^2-xc1.^2)-...
       bsxfun(@times, diff(vec0.^2).', xc1.*yc1);

请注意，我还使用了array transpose operator .'而不是complex conjugate transpose operator '。第一个只是重新组织数组而不修改值，而第二个可以在你处理complex data时给你不同的结果。

这是我用来比较两种方法的代码：

% Random test data:
vec0 = rand(2, 8100);
xc1 = rand(8100, 900);
yc1 = rand(8100, 900);

% Define anonymous functions to test:
fcn1 = @(v, x, y) (bsxfun(@times, v(1, :).', y)-bsxfun(@times, v(2, :).', x)).*...
                  (bsxfun(@times, v(2, :).', y)+bsxfun(@times, v(1, :).', x));
fcn2 = @(v, x, y) bsxfun(@times, prod(v).', y.^2-x.^2)-...
                  bsxfun(@times, diff(v.^2).', x.*y);

% Test the mathematical accuracy:
triw1 = fcn1(vec0, xc1, yc1);
triw2 = fcn2(vec0, xc1, yc1);
max(abs(triw1(:)-triw2(:)))

ans =
     4.440892098500626e-16

% Time the results:
t1 = timeit(@() fcn1(vec0, xc1, yc1))

t1 =
   0.107775908242267  % seconds

t2 = timeit(@() fcn2(vec0, xc1, yc1))

t2 =
   0.068403928901861  % seconds

对于双精度数字，两个结果之间的最大绝对差值为floating-point relative accuracy，因此实际上没有区别。

优化使用repmat和bsxfun的代码

1 个答案: