数组每列中的唯一元素(Matlab)

时间:2015-05-15 02:23:55

标签: arrays matlab unique element vectorization

我可能对Matlab有点生疏,也许这个问题的答案比我此时的想象更微不足道。但是我已经在网上搜索了有效的解决方案,但我还没找到,所以我会在这里试试。

我有一个大矩阵,类似于y:

N = 1e6; k = 20; n = 100;
y = ceil(n * rand(k, N));

对于数组的每一列,我想计算唯一元素的数量。循环非常慢:

tic
r = zeros(N, 1);
for ii = 1:N
  r(ii) = numel(unique(y(:, ii)));
end
toc

寻找矢量化,更快的版本。

David 的答案似乎也是正确而快速的。谢谢!

N = 1e6; k = 20; n = 100;
y = ceil(n * rand(k, N));

tic
r1 = zeros(N, 1);
for ii = 1:N
  r1(ii) = numel(unique(y(:, ii)));
end
toc

tic
r2 = sum(diff(sort(y)) ~= 0) + 1;
toc

all(r1' == r2)

1 个答案:

答案 0 :(得分:6)

试试这个

sum(diff(sort(y))~=0)+1

使用做矢量化的函数。对于你的情况,性能似乎比你的for循环更好,但是我认为对于更大的问题,由于内存限制,我提出的解决方案会变得更糟。

使用N=1e5,您的方法在我的计算机上需要大约7.5秒,而我的建议需要大约0.05秒。使用N=1e6时,时间约为75秒和0.75秒。