矢量化seq的优雅方式?

时间:2013-04-10 04:55:53

标签: r

尽管标题相似,但这与Vectorizing rep and seq in R不同。

我的直接目标:给定一个向量,我想生成一个新的向量,其中包含原始值以及旧值中每个值之间的间隔间隔。这并不困难。

一种策略是使用更通用的函数,给定两个向量和指定的by区间,使用相同的by值将seq重复应用于两个原始向量中的数字对。我没有找到这样做的内置函数。 seq似乎不能将向量作为参数处理。这是一个执行更一般操作的函数(我可以根据我的需要使用它):

multiseq <- function(froms, tos, by){
  x <- c(); 
  for (i in seq_along(froms)){
    x <- c(x, seq(from=froms[i], to=tos[i], by=by))
  }
  x
}

例如:

> multiseq(1:2, 1.75:2.75, .25)
[1] 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75

(这只是一个简单的例子。我真正想要的是用任意序列来做这件事,例如。

-0.89115386 -0.75346155 -0.61576924 -0.47807693 -0.34038463 -0.20269232 -0.06500001  0.07269230  0.21038460  0.34807691  0.48576922  0.62346153  0.76115383

我想将每个间隔细分为五个,以创建一个具有5倍元素的新序列。)

只要序列不太长,我相信,反复延伸矢量不应该太慢。如果我需要大序列,我可以重写以预先扩展矢量并填充它。但是,它仍然让我在循环中完成此操作。是否有更优雅,功能性的编程,R-ly方式?

感谢。

3 个答案:

答案 0 :(得分:12)

在R中,向量化函数的最简单方法之一是使用Vectorize函数。

基本上,您可以对from to参数进行矢量化,并将所有启动器作为from参数中的向量,并对to参数执行相同的操作

使用您的示例,您可以执行类似的操作

seq2 <- Vectorize(seq.default, vectorize.args = c("from", "to"))

c(seq2(from = c(1, 1.75), to = c(2, 2.75), by = 0.25))

## [1] 1.00 1.25 1.50 1.75 2.00 1.75 2.00 2.25 2.50 2.75

答案 1 :(得分:1)

尝试以下

x <- c(1, 2, 4, 8)
y <- unlist(mapply(FUN = function(from, to) {
    seq(from = from, to = to, by = 0.25)
}, head(x, -1), tail(x, -1)))
y
##  [1] 1.00 1.25 1.50 1.75 2.00 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75 6.00
## [24] 6.25 6.50 6.75 7.00 7.25 7.50 7.75 8.00

result <- y[!duplicated(y)]
result
##  [1] 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75 6.00 6.25 6.50
## [24] 6.75 7.00 7.25 7.50 7.75 8.00

答案 2 :(得分:1)

正如@TylerRinker在对我的问题的评论中所建议的那样,对于我的特殊需求,有一种解决方案比我对问题的表述更简单 - 我过于专注于某种特定的思考方式。由于我希望在已经规则间隔的数字之间插入有规律间隔的数字,因此我可以使用seq值将by应用于向量中的初始值和终值,该值均匀地划分为值之间的间隔在原始载体中:

subdiv <- function(x, by) seq(x[1], x[length(x)], by)
subdiv(1:4, .25)
[1] 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00
subdiv(c(-0.20269232, -0.06500001,  0.07269230), 0.1376923/3)
[1] -0.20269232 -0.15679489 -0.11089745 -0.06500002 -0.01910259  0.02679485  0.07269228

其中0.1376923是第二个应用程序中连续元素之间的差异。只要我不需要从原始向量中携带的元素完全等于它们的原始值,这个解决方案就可以了 - 正如您所看到的,由于浮点运算,存在一些差异。 (我实际上正在做的是为直方图构建箱子;精确的边界无关紧要。)

@ dickoa和@ geektrader的答案有更广泛的用途,并保留输入向量中原始数字的确切值。