在R中按顺序查找开始和停止索引

时间:2015-03-21 15:12:04

标签: r pattern-matching sequence indices

假设我有序列:

x = c( 1, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0)

在R中是否有一种优雅的方式来返回每个1s序列的开始和停止索引?

答案应该是一个2列数组,其中nRows =序列数为1:

startIndx = [ 1, 5, 7 ]
stopIndex = [ 2, 5, 9 ]

感谢。

BSL

5 个答案:

答案 0 :(得分:7)

假设您的向量由0和1值组成:

which(diff(c(0L, x)) == 1L)
#[1] 1 5 7
which(diff(c(x, 0L)) == -1L)
#[1] 2 5 9

否则你首先需要x <- x == 1L之类的东西。

答案 1 :(得分:4)

优雅的方式是

y <- which(x==1)
startIndx <- y[!(y-1) %in% y]
stopIndex <- y[!(y+1) %in% y]
rbind(startIndx, stopIndex)
#          [,1] [,2] [,3]
#startIndx    1    5    7
#stopIndex    2    5    9

答案 2 :(得分:2)

这个怎么样? [根据 alexis_laz ]的建议编辑版本

library(cgwtools)
res <- seqle(which(as.logical(x)))
rbind(res$values, res$values + res$lengths - 1)
     [,1] [,2] [,3]
[1,]    1    5    7
[2,]    2    5    9

答案 3 :(得分:1)

这个怎么样:

startIndx<-rev(length(x)-cumsum(rle(rev(x))$lengths)[rle(rev(x))$values==1]+1)
stopIndex<-cumsum(rle(x)$lengths)[rle(x)$values==1]

答案 4 :(得分:1)

试试这个:

y = rle(x)

stopIndex  = with(y, cumsum(lengths)[values==1])
startIndex = stopIndex - with(y, lengths[values==1]) + 1

#> stopIndex
#[1] 2 5 9
#> startIndex
#[1] 1 5 7