我认为我对R有一个非常基本的问题,但我很难找到一个例子。说我有一个数字向量
practice<-c(1,2,10,15,17,1,2,4)
我想计算数字之间的变化。矢量的长度固定为36个观测值。我想要计算的例子是((2/1)-1),((10 / 2-1),....我正在考虑构建一个for循环,我引用该位置并有一个与之关联的计数器它。
答案 0 :(得分:5)
使用R的一个好处是它的vectorization,这意味着它可以轻松地对整个矢量执行操作,而不必遍历每个元素。
正如David Arenburg在评论中所提到的(感谢BondedDust和Dominic Comtois的更新),您可以在这种情况下这样做:
practice[-1] / head(practice, -1) - 1
这是做什么的?
practice[-1]
引用除第一个元素之外的整个向量。
> practice[-1]
[1] 2 10 15 17 1 2 4
类似地,head(practice, -1)
引用除最后一个元素之外的整个向量。
> head(practice, -1)
[1] 1 2 10 15 17 1 2
如果我们除以这些,我们得到一个向量,由原始向量中的每个元素除以它之前的元素。我们可以直接划分这些向量,因为除法是一个向量化的运算。
> practice[-1] / head(practice, -1)
[1] 2.0000 5.0000 1.5000 1.1333 0.0588 2.0000 2.0000
> # ^ ^ ^ ^ ^ ^ ^
> # 2/1 10/2 15/10 17/15 1/17 2/1 4/2
正如你的例子所示,我们最后可以减去1。
> practice[-1] / head(practice, -1) - 1
[1] 1.0000 4.0000 0.5000 0.1333 -0.9412 1.0000 1.0000
这适用于向量中的每个元素,因为加法也是R中的向量化运算。
不需要循环!
等效的循环代码是:
x <- NULL
for (i in 1:(length(practice) - 1)) {
x[i] <- practice[i + 1] / practice[i] - 1
}
x
[1] 1.0000 4.0000 0.5000 0.1333 -0.9412 1.0000 1.0000
虽然这也能让你得到你想要的东西,但显然要长得多。实际上,在许多情况下,等效的循环代码也明显变慢,因为循环在每次迭代时都会带来很多额外的包袱。因此,除了简化代码之外,矢量化通常也会帮助加快速度。