我可能对Matlab有点生疏,也许这个问题的答案比我此时的想象更微不足道。但是我已经在网上搜索了有效的解决方案,但我还没找到,所以我会在这里试试。
我有一个大矩阵,类似于y:
N = 1e6; k = 20; n = 100;
y = ceil(n * rand(k, N));
对于数组的每一列,我想计算唯一元素的数量。循环非常慢:
tic
r = zeros(N, 1);
for ii = 1:N
r(ii) = numel(unique(y(:, ii)));
end
toc
寻找矢量化,更快的版本。
David 的答案似乎也是正确而快速的。谢谢!
N = 1e6; k = 20; n = 100;
y = ceil(n * rand(k, N));
tic
r1 = zeros(N, 1);
for ii = 1:N
r1(ii) = numel(unique(y(:, ii)));
end
toc
tic
r2 = sum(diff(sort(y)) ~= 0) + 1;
toc
all(r1' == r2)
答案 0 :(得分:6)
试试这个
sum(diff(sort(y))~=0)+1
使用做矢量化的函数。对于你的情况,性能似乎比你的for
循环更好,但是我认为对于更大的问题,由于内存限制,我提出的解决方案会变得更糟。
使用N=1e5
,您的方法在我的计算机上需要大约7.5秒,而我的建议需要大约0.05秒。使用N=1e6
时,时间约为75秒和0.75秒。