R移动平均函数处理值较小的窗口大小

时间:2017-09-21 17:37:14

标签: r dplyr zoo

this回答后,我使用了移动平均功能,窗口大小为2,3和4。

require(zoo)
#MOVING AVERAGE FUNCTION
get.mav <- function(df, n = 2){
  if(length(df) < n){
    return(df)
  } 
  c(df[1:(n-1)],rollapply(df,width = n, mean, align="right"))
}

#DATA FRAME (dummy)
ID <- c("d","b","a","a","c","e","b","d","b","b")
Value <- c(4,5,5,3,2,1,6,9,5,5)
df <-data.frame(ID,Value)

# FUNCTION IMPLEMENTATION
df <- with(df,df[order(ID),])
df$mav2 <- unlist(aggregate(Value~ID,df,get.mav,na.action = NULL,n=2)$Value) 
df$mav3 <- unlist(aggregate(Value~ID,df,get.mav,na.action = NULL,n=3)$Value) 
df$mav4 <- unlist(aggregate(Value~ID,df,get.mav,na.action = NULL,n=4)$Value) 

#OUTPUT
ID  Value   mav2    mav3    mav4
a   5   5   5   5
a   3   4   3   3
b   5   5   5   5
b   6   5.5 6   6
b   5   5.5 5.3 5
b   5   5   5.3 5.25
c   2   2   2   2
d   4   4   4   4
d   9   6.5 9   9
e   1   1   1   1

函数get.mav的工作方式完全正常。我想改变这个功能

对于窗口大小3,如果df长度为2,则取这两个元素的平均值而不是简单地返回df。

类似于窗口大小4,如果长度为3或2,则取三者或两个元素的平均值而不是简单地返回df。

我尝试了if语句,但比较无法正常工作。任何帮助将不胜感激。

感谢。

1 个答案:

答案 0 :(得分:1)

对于每个宽度,使用averollapplyr调用IDpartial = TRUE中的rollapplyr会导致它在开头附近平均部分点数。

library(zoo)

roll <- function(x, group, w) {
   ave(x, group, FUN = function(x) rollapplyr(x, w, mean, partial = TRUE))
}

transform(df[order(df$ID), ], 
   mav2 = roll(Value, ID, 2), 
   mav3 = roll(Value, ID, 3), 
   mav4 = roll(Value, ID, 4)
)

或者:

w <- 2:4
names(w) <- paste0("mav", w)

with(df[order(df$ID), ],
   data.frame(ID, Value, lapply(w, roll, x = Value, group = ID), check.names = FALSE)
)

要么:

   ID Value mav2     mav3     mav4
1   a     5  5.0 5.000000 5.000000
2   a     3  4.0 4.000000 4.000000
3   b     5  5.0 5.000000 5.000000
4   b     6  5.5 5.500000 5.500000
5   b     5  5.5 5.333333 5.333333
6   b     5  5.0 5.333333 5.250000
7   c     2  2.0 2.000000 2.000000
8   d     4  4.0 4.000000 4.000000
9   d     9  6.5 6.500000 6.500000
10  e     1  1.0 1.000000 1.000000

更新:已修复。