我有一系列值
c(1,2,3,4,5,8,9,10,13,14,15)
我想找到数字不连续的范围。我想要的只是输出:
(1,5)
(8,10)
(13,15)
我需要找到断点。
我需要在R中完成。
答案 0 :(得分:6)
这样的东西?
x <- c(1:5, 8:10, 13:15) # example data
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range)
# [[1]]
# [1] 1 5
#
# [[2]]
# [1] 8 10
#
# [[3]]
# [1] 13 15
另一个例子:
x <- c(1, 5, 10, 11:14, 20:21, 23)
unname(tapply(x, cumsum(c(1, diff(x)) != 1), range))
# [[1]]
# [1] 1 1
#
# [[2]]
# [1] 5 5
#
# [[3]]
# [1] 10 14
#
# [[4]]
# [1] 20 21
#
# [[5]]
# [1] 23 23
答案 1 :(得分:5)
x <- c(1:5, 8:10, 13:15)
rr <- rle(x - seq_along(x))
rr$values <- seq_along(rr$values)
s <- split(x, inverse.rle(rr))
s
# $`1`
# [1] 1 2 3 4 5
#
# $`2`
# [1] 8 9 10
#
# $`3`
# [1] 13 14 15
## And then to get *literally* what you asked for:
cat(paste0("(", gsub(":", ",", sapply(s, deparse)), ")"), sep="\n")
# (1,5)
# (8,10)
# (13,15)
答案 2 :(得分:1)
我发布了seqle
,它将在一行中为您完成此操作。您可以加载包cgwtools
或搜索SO以获取代码,因为它已经发布了几次。
答案 3 :(得分:0)
假设您不关心确切的输出并且正在寻找每个范围的最小值和最大值,您可以使用diff / cumsum / range,如下所示:
x <- c(1:5, 8:10, 13:15)
x. <- c(0, cumsum( diff(x)-1 ) )
lapply( split(x, x.), range )