我有一个简单的时间序列,我正在努力估计移动窗口内的方差。更具体地说,我无法解决与实现滑动窗口功能的方式有关的一些问题。例如,使用NumPy和窗口大小= 20时:
def rolling_window(a, window):
shape = a.shape[:-1] + (a.shape[-1] - window + 1, window)
strides = a.strides + (a.strides[-1],)
return np.lib.stride_tricks.as_strided(a, shape=shape, strides=strides)
rolling_window(data, 20)
np.var(rolling_window(data, 20), -1)
datavar=np.var(rolling_window(data, 20), -1)
在这个想法中,也许我错了。 有谁知道一个直截了当的方法吗? 任何帮助/建议都是最受欢迎的。
答案 0 :(得分:13)
你应该看看pandas。例如:
import pandas as pd
import numpy as np
# some sample data
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)).cumsum()
#plot the time series
ts.plot(style='k--')
# calculate a 60 day rolling mean and plot
pd.rolling_mean(ts, 60).plot(style='k')
# add the 20 day rolling variance:
pd.rolling_std(ts, 20).plot(style='b')
答案 1 :(得分:8)
Pandas rolling_mean
和rolling_std
函数已被弃用,取而代之的是更为通用的"滚动"框架。 @ elyase的例子可以修改为:
import pandas as pd
import numpy as np
%matplotlib inline
# some sample data
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)).cumsum()
#plot the time series
ts.plot(style='k--')
# calculate a 60 day rolling mean and plot
ts.rolling(window=60).mean().plot(style='k')
# add the 20 day rolling variance:
ts.rolling(window=20).std().plot(style='b')
rolling
函数支持许多不同的窗口类型,如文档here所述。可以在rolling
对象上调用许多函数,包括var
和其他有趣的统计信息(skew
,kurt
,quantile
等。我已经坚持std
,因为情节与平均值在同一个图表上,这在单位方面更有意义。
答案 2 :(得分:0)
尽管是旧线程,我将添加从this修改的另一种方法,该方法不依赖于熊猫,也不依赖python循环。本质上,使用numpy的跨步技巧,您可以首先跨步创建一个数组视图,以便沿最后一个轴计算函数的统计信息等效于执行滚动统计信息。我已经修改了原始代码,以便通过填充最后一条轴的起点来使输出形状与输入形状相同。
import numpy as np
def rolling_window(a, window):
pad = np.ones(len(a.shape), dtype=np.int32)
pad[-1] = window-1
pad = list(zip(pad, np.zeros(len(a.shape), dtype=np.int32)))
a = np.pad(a, pad,mode='reflect')
shape = a.shape[:-1] + (a.shape[-1] - window + 1, window)
strides = a.strides + (a.strides[-1],)
return np.lib.stride_tricks.as_strided(a, shape=shape, strides=strides)
a = np.arange(30).reshape((5,6))
# rolling mean along last axis
np.mean(rolling_window(a, 3), axis=-1)
# rolling var along last axis
np.var(rolling_window(a, 3), axis=-1)
# rolling median along last axis
np.median(rolling_window(a, 3), axis=-1)