在pandas数据框架上创建滚动自定义EWMA

时间:2016-08-08 18:50:47

标签: python pandas

我正在尝试使用以下衰减= 1-ln(2)/ 3来创建一个滚动的EWMA,其中df的最后13个值具有:

factor
Out[36]: 
    EWMA
0  0.043
1  0.056
2  0.072
3  0.094
4  0.122
5  0.159
6  0.207
7  0.269
8  0.350
9  0.455
10 0.591
11 0.769
12 1.000

我有像这样的月度回报:

change.tail(5)
Out[41]: 

date                                                                                                                                    
2016-04-30      0.033         0.031     0.010     0.007     0.014    -0.006    -0.001      0.035    -0.004     0.020     0.011     0.003
2016-05-31      0.024         0.007     0.017     0.022    -0.012     0.034     0.019      0.001     0.006     0.032    -0.002     0.015
2016-06-30     -0.027        -0.004    -0.060    -0.057    -0.001    -0.096    -0.027     -0.096    -0.034    -0.024     0.044     0.001
2016-07-31      0.063         0.036     0.048     0.068     0.053     0.064     0.032      0.052     0.048     0.013     0.034     0.036
2016-08-31     -0.004         0.012    -0.005     0.009     0.028     0.005    -0.002     -0.003    -0.001     0.005     0.013     0.003

我只是想将这个滚动的EWMA应用到每个列。我知道大熊猫有一个EWMA方法,但我无法弄清楚如何通过正确的1-ln(2)/ 3因子。

帮助将不胜感激!谢谢!

2 个答案:

答案 0 :(得分:2)

@piRSquared的答案是一个很好的近似值,但是在最后13个之外的值也有权重(虽然很小),所以它并不完全正确。

pandas可以进行滚动窗口计算。但是,在它支持的所有滚动功能中,ewm不是其中之一,这意味着我们必须实现自己的功能。

假设series是我们的平均时间序列:

from functools import partial
import numpy as np

window = 13
alpha = 1-ln(2)/3    # This is ewma's decay factor.
weights = list(reversed([(1-alpha)**n for n in range(window)]))
ewma = partial(np.average, weights=weight)
rolling_average = series.rolling(window).apply(ewma)

答案 1 :(得分:1)

ewmmean()

一起使用
df.ewm(halflife=1 - np.log(2) / 3).mean()

enter image description here