我有一个非常大的时间序列,包含大约14k个4变量的观察值(date
,x
,y
,z
)。
我如何(与计算当前值(diff( df$vector, lag = 1)
)和前一个值(t
)之间差异的函数t-1
相反)计算每个值下一个值(t+1
)和上一个值(t-1
)之间的差异?
答案 0 :(得分:0)
如果我理解你的问题,你想要的只是设置滞后= 2.
答案 1 :(得分:0)
因此,了解请求...生成一些数据:
#menu ul li a{
display: block;
}
数据如下:
set.seed(11)
a = sample(1:10, 10)
需要3 1 5 9 7 8 6 4 2 10
:
T+1 vs. T-1
随着成立......
T = 0 => No computation
T = 1 => 5 - 3 = 2
T = 2 => 9 - 1 = 8
...
T = 9 => 10 - 4 = 6
T = 10 => No computation
在#' Future Difference
#'
#' Obtain the lagged difference between X[t+1+lag] - X[t-1-lag]
#' @param x A \code{vec}
#' @param lag A \code{integer} indicating the lag
#' @return A \code{vec} with differences taken at T+lag v. T-lag
#' @examples
#' set.seed(11)
#' a = sample(1:10, 12)
#' fdiff(a)
fdiff = function(x, lag = 1){
# Number of obs
n = length(x)
# Trigger error to prevent subset
if(n < 2+lag){stop("`x` must be greater than `2+lag`")}
# X_(T+1) - X_(T-1)
x[(2+lag):n] - x[1:(n-lag-1)]
}
上拨打电话:
a
答案 2 :(得分:0)
您要找的是diff
的2! (你应该按照@Kake_Fisk的建议使用diff
而不是lag
。)使用@Coatless接受的答案中的数据:
set.seed(11)
a = sample(1:10, 10)
diff(a,2)
给出:
[1] 2 8 2 -1 -1 -4 -4 6
在OP评论后编辑:
如果我理解你的评论,那么@coatless接受的回答并不能满足你的要求。您正在寻找一个系列,它为您提供每个元素与其邻居的上一个和下一个差异。所以这个系列的长度必须是原始系列的2倍减去2(因为第一个元素没有前一个值,最后一个没有下一个值)。 一种可能的解决方案可能是:
set.seed(11)
a = sample(1:10, 10)
a
[1] 3 1 5 9 7 8 6 4 2 10
prev <- a[1:(length(a)-1)] - a[2:length(a)] # series of previous values
nxt <- -1 * prev # series of next values
nextPrevValues <- rep(0,2 * (length(a)-1))
for(i in 1:length(a)-1){
nextPrevValues[2*i-1] <- nxt[i]
nextPrevValues[2*i] <- prev[i]
}
从第一个元素到下一个元素的差异开始,您将获得每个元素的上一个和下一个差异。最后一个元素只有一个先前的值。
nextPrevValues
[1] -2 2 4 -4 4 -4 -2 2 1 -1 -2 2 -2 2 -2 2 8 -8