R中的滚动加权平均值(多次观察)

时间:2019-02-22 14:48:23

标签: r dplyr data.table

是否有任何快速函数能够计算加权的滚动平均值?这是必要的,因为每个数据点(以秒为单位的变化)有多个观察值(并非总是相同的数),并且将其取平均值。当我使用滚动平均值时,我想重新加权以获得一个无偏见的滚动平均值。

到目前为止,我想出了这个解决方案(在此示例中,窗口为3秒)。

sam <- data.table(val_mean=c(1:15),N=c(11:25))

sam[,weighted:=val_mean*N]

sam[,rollnumerator:=rollapply(weighted,3,sum,fill=NA,align="left")]

sam[,rolldenominator:=rollapply(N,3,sum,fill=NA,align="left")]

sam[,rollnumerator/rolldenominator]

我找不到任何已经解决了这个问题的问题。

这不是关于数据间距的不平等:我可以通过用NA扩展data.table来解决这一问题,以包括每一秒(上面的示例是等间距的)。另外,我也不想在RcppRoll的roll_mean中包含权重:在那里,所有时间窗口的权重都是固定的(“长度为n的向量,为窗口中每个元素的权重提供了权重 ”),而在我的情况下,权重根据当前处理的值而变化。第三,我不需要自适应窗口大小,它应该保持固定(例如3秒)。

1 个答案:

答案 0 :(得分:3)

1)使用by.column = FALSE

library(data.table)
library(zoo)

wmean <- function(x) weighted.mean(x[, 1], x[, 2])
sam[, rollapplyr(.SD, 3, wmean, by.column = FALSE, fill = NA, align = "left")]

2):另一种方法是将值和权重编码为复杂的向量:

wmean_cmplx <- function(x) weighted.mean(Re(x), Im(x))
sam[, rollapply(complex(real = val_mean, imag = N), 3, wmean_cmplx, 
  fill = NA, align = "left")]