我正在尝试使用Python(使用Pandas)来计算英特尔(INTC)每日股票数据的20天指数移动平均线(EMA)。 Pandas有很多方法可以做到这一点,我也尝试过在Pandas上运行的stockstats,但它们从来没有像我从股票/金融网站那样返回相同的EMA。
我已经仔细检查了收盘价,但它们相符,但EMA总是出现“错误”。
这是我正在使用的CSV:INTC Stock Data
它包含2016年2月20日至2月1日期间英特尔股票(股票代码:INTC)的每日日期,月份名称,开盘价,最高价,最低价,收盘价,日平均价和成交量。
当我查看较大的股票网站时,如MarketWatch或Fidelity,他们的数字与我的不相符。他们匹配彼此,但不是我。
例如......
df2['Close'].ewm(span=20,min_periods=0,adjust=False,ignore_na=False).mean()
...或
df2['Close'].ewm(span=20, min_periods=20, adjust=True).mean()
...或
df2["Close"].shift().fillna(df["Close"]).ewm(com=1, adjust=False).mean()
在任何财务网站上的真实的20天EMA 为$ 45.65时,给我218/2018的EMA,如$ 44.71,$ 47.65,$ 46.15等。无论我尝试计算EMA的日期,我得到的数字都是错误的。当我尝试5天EMA时,这甚至是错误的。
我已阅读,观看并关注该主题的教程,但其结果也与您在任何金融网站上找到的已接受/已发布的EMA不符。在Panda捣乱数字之后,创建教程和视频的人们根本就不会互相检查它们。我需要我的数字才能匹配。
我如何得到相同的数字互联网上的其他财务网站正在获取EMA?我不认为这与调整后的收盘价有任何关系,因为我使用的是旧的/结算数据,我的收盘价和日期与他们的相同。
答案 0 :(得分:13)
对DataFrame进行排序,使日期按递增顺序排列。
由于您的数据按日期递减排序,如果您不先对日期进行排序,则ewm
计算会对最早日期进行指数级加权,而不是最新日期(因为它应该是)。
import pandas as pd
df = pd.read_csv('intc_data.txt', parse_dates=['Date'], index_col=['Date'])
df['backward_ewm'] = df['Close'].ewm(span=20,min_periods=0,adjust=False,ignore_na=False).mean()
df = df.sort_index()
df['ewm'] = df['Close'].ewm(span=20,min_periods=0,adjust=False,ignore_na=False).mean()
print(df[['ewm', 'backward_ewm']].tail())
产量
ewm backward_ewm
Date
2018-01-26 45.370936 48.205638
2018-01-29 45.809895 48.008337
2018-01-30 46.093714 47.800794
2018-01-31 46.288599 47.696667
2018-02-01 46.418256 47.650000
这同意Marketwatch,其中说2018-02-01的EWMA(20)为46.42。
答案 1 :(得分:4)
我建议使用 Pandas TA 在 python 中计算技术指标。我发现它比熊猫自带的更准确,指标也更多。
使用 Pandas TA,计算 20 周期指数移动平均线如下:
import pandas_ta as ta
data["EMA20"] = ta.ema(df2["Close"], length=20)