我正在尝试从Matlab(或Octave)中的数字向量中修剪任何长度为3或更长的序列。例如,给定vector dataSet ,
dataSet = [1 2 3 7 9 11 13 17 18 19 20 22 24 25 26 28 30 31];
删除长度为3或更长的所有序列将产生prunedDataSet:
prunedDataSet = [7 9 11 13 22 28 30 31 ];
我可以强制解决方案,但我怀疑使用向量/矩阵操作有一种更简洁(也许是有效)的方法,但我总是对某些东西产生索引或所述索引的值感到困惑。建议?
这是我想出的蛮力方法:
dataSet = [1 2 3 7 9 11 13 17 18 19 20 22 24 25 26 28 30 31];
benign = [];
for i = 1:size(dataSet,2)-2;
if (dataSet(i) == (dataSet(i+1)-1) && dataSet(i) == dataSet(i+2)-2);
benign = [benign i ] ;
end;
end;
remove = [];
for i = 1:size(benign,2);
remove = [remove benign(i) benign(i)+1 benign(i)+2 ];
end;
remove = unique(remove);
prunedDataSet = setdiff(dataSet, dataSet(remove));
答案 0 :(得分:6)
%# define dataset
dataSet = [1 2 3 7 9 11 13 17 18 19 20 22 24 25 26 28 30 31];
%# take the difference. Whatever is part of a sequence will have difference 1
dds = diff(dataSet);
%# sequences of 3 lead to two consecutive ones. Sequences of 4 are like two sequences of 3
seqIdx = findstr(dds,[1 1]);
%# remove start, start+1, start+2
dataSet(bsxfun(@plus,seqIdx,[0;1;2])) = []
dataSet =
7 9 11 13 22 28 30 31
答案 1 :(得分:4)
这是使用矢量矩阵表示法的尝试:
s1 = [(dataSet(1:end-1) == dataSet(2:end)-1), false];
s2 = [(dataSet(1:end-2) == dataSet(3:end)-2), false, false];
s3 = s1 & s2;
s = s3 | [false, s3(1:end-1)] | [false, false, s3(1:end-2)];
dataSet(~s)
我的想法是:s1
适用于a
之前出现数字a+1
的所有排名。 s2
适用于a
在a+2
之前出现两个位置的所有位置。然后s
在前两个条件都满足的情况下变为真。然后,我们构建s
,以便将每个真值传播给它的两个后继者。
最后,dataSet(~s)
保留上述条件为假的所有值,即保留不属于3序列的数字。