从3列csv计算股票价格波动率

时间:2016-08-08 11:57:34

标签: python pandas stocks yield-return volatility

我正在寻找一种方法来使以下代码工作:

import pandas

path = 'data_prices.csv'
data =  pandas.read_csv(path, sep=';')
data = data.sort_values(by=['TICKER', 'DATE'], ascending=[True, False])
data.columns

我有一个包含三列的二维数组,数据如下所示:

DATE;TICKER;PRICE
20151231;A UN Equity;41.81
20151230;A UN Equity;42.17
20151229;A UN Equity;42.36
20151228;A UN Equity;41.78
20151224;A UN Equity;42.14
20151223;A UN Equity;41.77
20151222;A UN Equity;41.22
20151221;A UN Equity;40.83
20151218;A UN Equity;40.1
20091120;PCG UN Equity;42.1
20091119;PCG UN Equity;41.53
20091118;PCG UN Equity;41.86
20091117;PCG UN Equity;42.23
20091116;PCG UN Equity;42.6
20091113;PCG UN Equity;41.93
20091112;PCG UN Equity;41.6
20091111;PCG UN Equity;42.01

现在,我想计算x天实现的波动率,其中x来自输入字段,x不应大于观察数。

需要采取的步骤:

  • 计算每行的日志回报
  • 获取这些回报并在其上运行标准差
  • 乘以255的平方根以规范每年的波动率

1 个答案:

答案 0 :(得分:0)

道歉,它并不完全清楚您希望的输出类型,因此我假设您想要输入股票代码和期间(x)并查看当前的波动率数字。下面我也使用了numpy,以防你没有那个库。

基本上我已经为所有原始数据创建了一个DataFrame,然后为给定的自动收录器过滤了一个新的DF(用户只需输入' A'或者' PCG'部分,因为“UN Equity'假定为常数”。在这个新的DF中,在检查您的期间(x)输入不是太高之后,它将输出最近的年化波动率值。

import numpy as np
import pandas as pd

data = pd.read_csv('dump.csv', sep=';')
data = data.sort_values(by=['TICKER','DATE'],ascending=[True,True])


def vol(ticker, x):
    df = pd.DataFrame(data)
    df['pct_chg'] = df.PRICE.pct_change()
    df['log_rtn'] = np.log(1 + df.pct_chg)

    df_filtered = df[df.TICKER==ticker+' UN Equity']

    max_x = len(df_filtered) - 1
    if x > max_x:
        print('Too many periods. Reduce x')

    df_filtered['vol'] = pd.rolling_std(df_filtered.log_rtn, window=x) * (255**0.5)

    print(df_filtered.vol.iloc[-1])

例如,输入 vol(' PCG',6),输出为0.187855386042

如果我误解了您的请求,可能不是最优雅和道歉。