向量化回归图计算

时间:2018-07-22 16:03:34

标签: matlab performance regression vectorization covariance

我通过以下方式在字段A(t)上计算时间序列B(x,y,t)的回归图:

A=1:10; %time
B=rand(100,100,10); %x,y,time

rc=nan(size(B,1),size(B,2));
for ii=size(B,1)
  for jj=1:size(B,2)
     tmp = cov(A,squeeze(B(ii,jj,:))); %covariance matrix
     rc(ii,jj) = tmp(1,2); %covariance A and B
  end
end
rc = rc/var(A); %regression coefficient

是否可以向量化/加速代码?还是一些我不知道的内置函数来实现相同的结果?

1 个答案:

答案 0 :(得分:2)

为了矢量化该算法,您将必须“动手”并自己计算协方差。如果您查看cov的内部,您会发现它有很多行输入检查和很少几行实际计算,以总结关键步骤:

y = varargin{1};
x = x(:);
y = y(:);
x = [x y];
[m,~] = size(x);
denom = m - 1;
xc = x - sum(x,1)./m;  % Remove mean
c = (xc' * xc) ./ denom;

为简化以上操作,

x = [x(:) y(:)];
m = size(x,1);
xc = x - sum(x,1)./m;
c = (xc' * xc) ./ (m - 1);

现在这是很容易向量化的事情...

function q51466884
A = 1:10; %time
B = rand(200,200,10); %x,y,time
%% Test Equivalence:
assert( norm(sol1-sol2) < 1E-10);
%% Benchmark:
disp([timeit(@sol1), timeit(@sol2)]);

%%
function rc = sol1()
rc=nan(size(B,1),size(B,2));
for ii=1:size(B,1)
  for jj=1:size(B,2)
     tmp = cov(A,squeeze(B(ii,jj,:))); %covariance matrix
     rc(ii,jj) = tmp(1,2); %covariance A and B
  end
end
rc = rc/var(A); %regression coefficient
end

function rC = sol2()  
m = numel(A);
rB = reshape(B,[],10).'; % reshape
% Center:
cA = A(:) - sum(A)./m;
cB = rB - sum(rB,1)./m;
% Multiply:
rC = reshape( (cA.' * cB) ./ (m-1), size(B(:,:,1)) ) ./ var(A);
end

end

我得到以下计时:[0.5381 0.0025],这意味着我们在运行时节省了两个数量级:)

请注意,优化算法的很大一部分是假设您的数据中没有任何“奇怪”,例如NaN值等。在cov.m内进行查看以查看所有检查我们跳过了。