在Matlab / Octave中从向量中识别(和移除)序列

时间:2011-05-27 21:05:50

标签: matlab octave

我正在尝试从Matlab(或Octave)中的数字向量中修剪任何长度为3或更长的序列。例如,给定vector dataSet

dataSet = [1 2 3 7 9 11 13 17 18 19 20 22 24 25 26 28 30 31];

删除长度为3或更长的所有序列将产生prunedDataSet:

prunedDataSet = [7 9 11 13 22 28 30 31 ];

我可以强制解决方案,但我怀疑使用向量/矩阵操作有一种更简洁(也许是有效)的方法,但我总是对某些东西产生索引或所述索引的值感到困惑。建议?

这是我想出的蛮力方法:

dataSet = [1 2 3 7 9 11 13 17 18 19 20 22 24 25 26 28 30 31];
benign = [];
for i = 1:size(dataSet,2)-2;
    if (dataSet(i) == (dataSet(i+1)-1) && dataSet(i) == dataSet(i+2)-2);
        benign = [benign i ] ;
    end;
end;

remove = [];
for i = 1:size(benign,2);
    remove = [remove benign(i) benign(i)+1 benign(i)+2 ];
end;

remove = unique(remove);

prunedDataSet = setdiff(dataSet, dataSet(remove));

2 个答案:

答案 0 :(得分:6)

以下是使用DIFFSTRFIND

的解决方案
%# define dataset
dataSet = [1 2 3 7 9 11 13 17 18 19 20 22 24 25 26 28 30 31];

%# take the difference. Whatever is part of a sequence will have difference 1
dds = diff(dataSet);

%# sequences of 3 lead to two consecutive ones. Sequences of 4 are like two sequences of 3
seqIdx = findstr(dds,[1 1]);

%# remove start, start+1, start+2
dataSet(bsxfun(@plus,seqIdx,[0;1;2])) = []
dataSet =

     7     9    11    13    22    28    30    31

答案 1 :(得分:4)

这是使用矢量矩阵表示法的尝试:

s1 = [(dataSet(1:end-1) == dataSet(2:end)-1), false];
s2 = [(dataSet(1:end-2) == dataSet(3:end)-2), false, false];
s3 = s1 & s2;
s = s3 | [false, s3(1:end-1)] | [false, false, s3(1:end-2)];
dataSet(~s)

我的想法是:s1适用于a之前出现数字a+1的所有排名。 s2适用于aa+2之前出现两个位置的所有位置。然后s在前两个条件都满足的情况下变为真。然后,我们构建s,以便将每个真值传播给它的两个后继者。

最后,dataSet(~s)保留上述条件为假的所有值,即保留不属于3序列的数字。