如何在R中的一组非连续数中得到最小数和最大数

时间:2016-02-25 18:50:40

标签: r numeric minmax

我有一组数字:1,2,3,7,8,9,12,13,14...我希望得到每个连续部分的最小值和最大值,因此结果应为1-3,7-9,12-14

我可以使用for循环来比较并获得最大最大值,但如果我有超过1000万个数字,这种方式需要很长时间......

有没有人知道是否有更快的方法来获得我想要的东西? 谢谢!

1 个答案:

答案 0 :(得分:0)

正如评论中所述,diff可以帮助找出差距。使用该索引,我们可以拆分向量并提取每个组的第一个和最后一个:

c(sapply(split(x, cumsum(c(T, diff(x)>1))), function(v) c(v[1], tail(v,1)*-1)))
[1]   1  -3   7  -9  12 -14

解决方案是打高尔夫球。要扩展,我们可以分开每个电话:

#Identify gaps in vector
changes <- cumsum(c(TRUE, diff(x) > 1L)

#Split vector on the above index
veclist <- split(x, changes)

#function to extract first item and the last item multiplied by -1
first_last <- function(v) c(v[1], tail(v,1)*-1)

#extract first and last from veclist
mat <- sapply(veclist, first_last)

#Remove list structure
c(mat)
[1]   1  -3   7  -9  12 -14