我正在尝试构建一个指数移动平均算法,它产生与Pandas ewm()
函数相同的输出。特别是,我正在尝试实施这种方法:
下面的代码可以正常工作,直到移动平均窗口开始移动到初始数据集之外,此时我开始得到与Pandas计算不同的结果。
我一直在看这几个小时,我很难过。任何人都可以向我指出我是如何误解上述公式的吗?
import numpy as np
import pandas as pd
class MovingAverages(object):
def __init__(self, **kwargs):
self.measures = []
self.lookback_period = 5
ema_multiplier = 2 / (self.lookback_period + 1)
self.lookback_alphas = []
for i in range(1,self.lookback_period+1):
self.lookback_alphas.append((1 - ema_multiplier ) ** i)
def insert_bar(self):
self.measures.insert(0, 0)
def on_calculate(self, c):
index = min(len(c), self.lookback_period+1)
y = c[0]
for i in range(1,index):
y += self.lookback_alphas[i-1] * c[i]
y /= 1 + sum(self.lookback_alphas[0:index-1])
self.measures[0] = y
if __name__ == "__main__":
data = [5.00,7.00,4.00,3.00,4.00,
5.00,6.00,7.00,9.00,13.00,
15.00,14.00,14.00,12.00,
11.00,10.00,9.00,8.00,
8.00,8.00,10.00,11.00,
13.00,16.00,18.00,20.00]
# Manually calculate exponential MA and write into list
ma_online = MovingAverages()
series = []
for d in data:
series.insert(0, d)
ma_online.insert_bar()
ma_online.on_calculate(series)
# Calculate a reference exponential MA using Pandas
df = pd.DataFrame({'close': data})
ma_pd = list(df.close.ewm(span=ma_online.lookback_period, adjust=True, ignore_na=True).mean())
# Compare the two lists
ma_online.measures.reverse()
for i in range(len(data)):
assert round(ma_pd[i], 2) == round(ma_online.measures[i], 2)
答案 0 :(得分:1)
我不熟悉Python或Panda,但根据我对文档的理解,当你在span
中使用df.close.ewm(span=ma_online,...)
时,你只需在公式中定义衰变(系数),而不是滑动窗口的大小。默认情况下,似乎没有固定的侧窗口。
来自another documentation of DataFrame.ewm:
span:float,可选
根据跨度指定衰减,α= 2 /(span + 1),对于span≥1
和
另见:
rolling:提供滚动窗口计算
rolling
方法可能就是您所需要的。