用于大规模数据分析的Xarray或Multi Index DataFrame

时间:2017-12-21 22:20:13

标签: python pandas

我刚刚找到了如何将{(3}}

的历史股票价格导入数组

我是使用此代码

完成的
import pandas_datareader as pdr
import pandas as pd
import numpy as np
import fix_yahoo_finance as yf

#yf.pdr_override()

source = 'yahoo'
stocks = ['AAPL', 'AMZN', 'MSFT', 'GOOG', 'GE']
start = '2017-01-01'
end_date = '2017-12-10'

data_array = pdr.DataReader(stocks, source, start,)['Adj Close']

print (data_array)

问题是我有警告

  

Panel已弃用,将在以后的版本中删除。该   推荐的方式来表示这些类型的三维数据   通过Panel.to_frame()方法在DataFrame上使用MultiIndex   或者,您可以使用xarray包   http://www.pythonforfinance.net/2017/01/21/investment-portfolio-optimisation-with-python/。熊猫提供.to_xarray()   帮助自动执行此转换的方法。

所以我需要建议,我的目标是将数据保存为CSV或excel文件。第二步是取最后x天价格的平均值,然后将当前价格除以平均值,最后在每天的股票上做一个百分比排名。考虑到多个步骤,我想把它全部写进去,一步一步地进行,并且不必每天重新计算所有历史记录。

问题:鉴于这个目标,什么是更好的方法:数据框架上的Xarray或MultiIndex?

0 个答案:

没有答案