滚动平均值返回DataFrame

时间:2018-10-15 08:02:03

标签: python pandas rolling-average

我想为5年(60个月)滚动回报的每只股票在以下数据框中添加列。以下代码用于获取1995年至2010年期间的财务数据。

quandl.ApiConfig.api_key = 'Enter Key'
stocks = ['MSFT', 'AAPL', 'WMT', 'GE', 'KO']
stockdata = quandl.get_table('WIKI/PRICES', ticker = stocks, paginate=True,
                    qopts = { 'columns': ['date', 'ticker', 'adj_close'] },
                    date = { 'gte': '1995-1-1', 'lte': '2010-12-31' })

# Setting date as index with columns of tickers and adjusted closing price

df = stockdata.pivot(index = 'date',columns='ticker')
df.index = pd.to_datetime(df.index)
df.resample('1M').mean()
df = df.pct_change()

df.head()
Out[1]: 
              rets                                                    
ticker          AAPL        BA         F        GE       JNJ        KO   
 date                                                                     
1995-01-03       NaN       NaN       NaN       NaN       NaN       NaN   
1995-01-04  0.026055 -0.002567  0.026911  0.000000  0.006972 -0.019369   
1995-01-05 -0.012697  0.002573 -0.008735  0.002549 -0.002369 -0.004938   
1995-01-06  0.080247  0.018824  0.000000 -0.004889 -0.006758  0.000000   
1995-01-09 -0.019048  0.000000  0.017624 -0.009827 -0.011585 -0.014887 

df.tail()
Out[2]: 
              rets
ticker          AAPL        BA         F        GE       JNJ        KO   
 date                                                                     
2010-12-27  0.003337 -0.004765  0.005364  0.008315 -0.005141 -0.007777   
2010-12-28  0.002433  0.001699 -0.008299  0.007147  0.001938  0.004457   
2010-12-29 -0.000553  0.002929  0.000598 -0.002729  0.001289  0.001377   
2010-12-30 -0.005011 -0.000615 -0.002987 -0.004379 -0.003058  0.000764   
2010-12-31 -0.003399  0.003846  0.005992  0.005498 -0.001453  0.004122 

任何有关此操作的帮助都很棒!

2 个答案:

答案 0 :(得分:1)

问题出在列中的多级索引中。我们可以从选择第二级索引开始,然后滚动平均值起作用:

means = df['rets'].rolling(60).mean() 
means.tail() 

礼物:

enter image description here

答案 1 :(得分:0)

您收到的错误是由于您将整个数据帧传递给滚动函数,因为您的帧使用了多索引。您不能将多索引框架传递给滚动函数,因为滚动仅接受1列的numpy数组。您可能必须创建一个for循环,并在每个报价器中分别返回值