如何查找R中的数字是否连续?

时间:2014-04-15 22:05:30

标签: r statistics

我有一系列值

c(1,2,3,4,5,8,9,10,13,14,15)

我想找到数字不连续的范围。我想要的只是输出:

(1,5)
(8,10)
(13,15)

我需要找到断点。

我需要在R中完成。

4 个答案:

答案 0 :(得分:6)

这样的东西?

x <- c(1:5, 8:10, 13:15) # example data
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range)
# [[1]]
# [1] 1 5
# 
# [[2]]
# [1]  8 10
# 
# [[3]]
# [1] 13 15

另一个例子:

x <- c(1, 5, 10, 11:14, 20:21, 23)
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range))
# [[1]]
# [1] 1 1
#
# [[2]]
# [1] 5 5
#
# [[3]]
# [1] 10 14
#
# [[4]]
# [1] 20 21
#
# [[5]]
# [1] 23 23

答案 1 :(得分:5)

x <- c(1:5, 8:10, 13:15)    
rr <- rle(x - seq_along(x))
rr$values <- seq_along(rr$values)
s <- split(x, inverse.rle(rr))
s
# $`1`
# [1] 1 2 3 4 5
# 
# $`2`
# [1]  8  9 10
# 
# $`3`
# [1] 13 14 15

## And then to get *literally* what you asked for:
cat(paste0("(", gsub(":", ",", sapply(s, deparse)), ")"), sep="\n")
# (1,5)
# (8,10)
# (13,15)

答案 2 :(得分:1)

我发布了seqle,它将在一行中为您完成此操作。您可以加载包cgwtools或搜索SO以获取代码,因为它已经发布了几次。

答案 3 :(得分:0)

假设您不关心确切的输出并且正在寻找每个范围的最小值和最大值,您可以使用diff / cumsum / range,如下所示:

x  <- c(1:5, 8:10, 13:15)
x. <- c(0, cumsum( diff(x)-1 ) ) 

lapply( split(x, x.), range )