Question

我正在尝试构建一个指数移动平均算法，它产生与Pandas ewm()函数相同的输出。特别是，我正在尝试实施这种方法：

下面的代码可以正常工作，直到移动平均窗口开始移动到初始数据集之外，此时我开始得到与Pandas计算不同的结果。

我一直在看这几个小时，我很难过。任何人都可以向我指出我是如何误解上述公式的吗？

import numpy as np
import pandas as pd

class MovingAverages(object):
    def __init__(self, **kwargs):
        self.measures = []
        self.lookback_period = 5 
        ema_multiplier = 2 / (self.lookback_period + 1)
        self.lookback_alphas = []
        for i in range(1,self.lookback_period+1):
            self.lookback_alphas.append((1 - ema_multiplier ) ** i)

    def insert_bar(self):
        self.measures.insert(0, 0)

    def on_calculate(self, c):
        index = min(len(c), self.lookback_period+1)
        y = c[0]
        for i in range(1,index):
            y += self.lookback_alphas[i-1] * c[i]
        y /= 1 + sum(self.lookback_alphas[0:index-1])
        self.measures[0] = y

if __name__ == "__main__":
    data = [5.00,7.00,4.00,3.00,4.00,
            5.00,6.00,7.00,9.00,13.00,
            15.00,14.00,14.00,12.00,
            11.00,10.00,9.00,8.00,
            8.00,8.00,10.00,11.00,
            13.00,16.00,18.00,20.00]

    # Manually calculate exponential MA and write into list 
    ma_online = MovingAverages()
    series = []
    for d in data:
        series.insert(0, d)
        ma_online.insert_bar()
        ma_online.on_calculate(series)

    # Calculate a reference exponential MA using Pandas
    df = pd.DataFrame({'close': data})
    ma_pd = list(df.close.ewm(span=ma_online.lookback_period, adjust=True, ignore_na=True).mean())

    # Compare the two lists
    ma_online.measures.reverse()
    for i in range(len(data)):
        assert round(ma_pd[i], 2) == round(ma_online.measures[i], 2)

Answer 1

我不熟悉Python或Panda，但根据我对文档的理解，当你在span中使用df.close.ewm(span=ma_online,...)时，你只需在公式中定义衰变（系数），而不是滑动窗口的大小。默认情况下，似乎没有固定的侧窗口。

来自another documentation of DataFrame.ewm：

span：float，可选
根据跨度指定衰减，α= 2 /（span + 1），对于span≥1

和

另见：
rolling：提供滚动窗口计算

rolling方法可能就是您所需要的。

根据Pandas ewm（）计算指数移动平均线

1 个答案: