在二进制数组中查找连续数的数量

时间:2015-03-01 09:03:03

标签: arrays matlab run-length-encoding

我想在MATLAB中找到逻辑数组中所有1和0系列的长度。这就是我所做的:

A = logical([0 0 0 1 1 1 1 0 1 1 0 0 0 0 0 0 1 1 1 1 1]);
%// Find series of ones:
csA = cumsum(A);
csOnes = csA(diff([A 0]) == -1);
seriesOnes = [csOnes(1) diff(csOnes)];
%// Find series of zeros (same way, using ~A)
csNegA = sumsum(~A);
csZeros = csNegA(diff([~A 0]) == -1);
seriesZeros = [csZeros(1) diff(csZeros)];

这样可行,并提供seriesOnes = [4 2 5]seriesZeros = [3 1 6]。然而,在我看来这是相当丑陋的。

我想知道是否有更好的方法来做到这一点。性能不是问题,因为这很便宜(A不超过几千个元素)。我正在寻找代码清晰和优雅。

如果没有更好的办法,我会把它放在一个小辅助函数中,所以我不必看它。

3 个答案:

答案 0 :(得分:2)

您可以使用 run-length-encoding 的现有代码,它可以为您执行(丑陋)工作,然后自行过滤掉您的矢量。通过这种方式,您的辅助函数非常通用,其功能在名称runLengthEncode中很明显。

重用this answer中的代码:

function [lengths, values] = runLengthEncode(data)
startPos = find(diff([data(1)-1, data]));
lengths = diff([startPos, numel(data)+1]);
values = data(startPos);

然后您将使用以下方法过滤掉您的向量:

A = logical([0 0 0 1 1 1 1 0 1 1 0 0 0 0 0 0 1 1 1 1 1]);
[lengths, values] = runLengthEncode(A);
seriesOnes = lengths(values==1);
seriesZeros = lengths(values==0);

答案 1 :(得分:1)

你可以试试这个:

A = logical([0 0 0 1 1 1 1 0 1 1 0 0 0 0 0 0 1 1 1 1 1]);
B = [~A(1) A ~A(end)];                %// Add edges at start/end
edges_indexes = find(diff(B));        %// find edges
lengths = diff(edges_indexes);        %// length between edges

%// Separate zeros and ones, to a cell array
s(1+A(1)) = {lengths(1:2:end)};
s(1+~A(1)) = {lengths(2:2:end)};

答案 2 :(得分:0)

这种strfind(基于数值数组和字符串数组的方法非常有效)可以更容易理解 -

%// Find start and stop indices for ones and zeros with strfind by using
%// "opposite (0 for 1 and 1 for 0) sentients" 
start_ones = strfind([0 A],[0 1]) %// 0 is the sentient here and so on
start_zeros = strfind([1 A],[1 0])
stop_ones = strfind([A 0],[1 0])
stop_zeros = strfind([A 1],[0 1])

%// Get lengths of islands of ones and zeros using those start-stop indices 
length_ones = stop_ones - start_ones + 1
length_zeros = stop_zeros - start_zeros + 1