Question

我很难从去年的观察中获得变量的最大值（不是每年！）并将其实施到每一行（观察）。

我认为最好的方法是使用rollapply函数，但我无法弄清楚宽度应该是什么样子，因为每次观察可能会有所不同（每次观察代表一天但不是所有天都观察到）。我知道使用list会产生偏移值，所以这些值看起来如何？

我得到的代码：

mutate(data,"Feature"=rollapplyr(variable,list(0,"Go back one year"),max,fill=NA))

示例以澄清：行的日期为2016年8月31日。我希望新列（使用dplyr包的mutate）在此行中显示从2015年8月31日到2016年8月31日（此行）的variable的最大值。

对于那些想要更进一步的人：当计算出的最大variable高于阈值时，不显示TRUE值 - 显示FALSE或1（或0 / variable）。

Answer 1

如果没有进一步的细节，很难回答。但看看这是否是你需要的：

data=data.frame(Data=seq.Date(as.Date("2001-01-01"),as.Date("2005-12-31"),by = "month"),Var=sample(1:1000,60,TRUE))
#exclude some lines
data=data[-c(10,15,17:21),]


 # using for
    for (i  in 1:nrow(data)){ # i=1
      data$Max[i]=max(data[data$Data>(data$Data[i]-360) & data$Data<=data$Data[i],"Var"])
    }


# using rollapply
 # one year interval from dates   
    for (i  in 1:nrow(data)){ # i=1
      data$Oneyear[i]=length(data$Data[data$Data>(data$Data[i]-360) & data$Data<=data$Data[i]])
    }  

data$Maxr=rollapplyr(data$Var, data$Oneyear, max)

使用

set.seed(123)

你会得到：

> tail(data)
         Data Var Oneyear Max Maxr
55 2005-07-01 561      12 858  858
56 2005-08-01 207      12 858  858
57 2005-09-01 128      12 858  858
58 2005-10-01 754      12 858  858
59 2005-11-01 896      12 896  896
60 2005-12-01 375      12 896  896

计算去年观测的最大值

1 个答案: