有没有办法在2D数组中提取连续特征

时间:2010-03-18 13:56:27

标签: r arrays sequence continue

说我有一个数字数组

a< -c(1,2,3,6,7,8,9,10,20)

如果有办法告诉R只输出连续序列的范围来自“a” 例如,“a”中的连续序列如下:

1,3 6,10 20

非常感谢! 德里克

3 个答案:

答案 0 :(得分:2)

我认为没有直接的方法,但你可以创建两个逻辑向量,告诉你下一个/前一个元素是1最大/最小。 E.g:

data.frame(
  a,
  is_first = c(TRUE,diff(a)!=1),
  is_last = c(diff(a)!=1,TRUE)
)
# Gives you:
   a is_first is_last
1  1     TRUE   FALSE
2  2    FALSE   FALSE
3  3    FALSE    TRUE
4  6     TRUE   FALSE
5  7    FALSE   FALSE
6  8    FALSE   FALSE
7  9    FALSE   FALSE
8 10    FALSE    TRUE
9 20     TRUE    TRUE

所以范围是:

cbind(a[c(TRUE,diff(a)!=1)], a[c(diff(a)!=1,TRUE)])
[1,]    1    3
[2,]    6   10
[3,]   20   20

答案 1 :(得分:1)

如果你想要列表中每个序列的所有数字,我这样做(我承认不是那么优雅)

a <- c(1,2,3,6,7,8,9,10,20)

z <- c(1,which(c(1,diff(a))!=1))

g <- lapply(seq(1:length(z)),function(i) {
if (i < length(z)) a[z[i] : (z[i+1] - 1)] 
else a[z[i] : length(a)] 
})


[[1]]
[1] 1 2 3

[[2]]
[1]  6  7  8  9 10

[[3]]
[1] 20

然后你可以得到一个类似这样的2D数组

sapply(g,function(x) c(x[1],x[length(x)]))

     [,1] [,2] [,3]
[1,]    1    6   20
[2,]    3   10   20

答案 2 :(得分:0)

> a <- c(1,2,3,6,7,8,9,10,20)
> N<-length(a)
> k<-2:(N-1)
> z<-(a[k-1]+1)!=a[k] | (a[k+1]-1)!=a[k]
> c(a[1],a[k][z],a[N])
[1]  1  3  6 10 20