我想在使用新数据进行更新时扩展pandas时间序列。以下是我为股票数据创建初始Panel的方法。这是最初的空面板:
def create_blank_data():
dates = pd.date_range(start=dt.date(2008, 1, 1), end=dt.date.today())
attrs = ['Open', 'High', 'Low', 'Close', 'Volume', 'Adj Close']
symbols_ = symbols.read()
data = np.zeros((len(symbols_), len(dates), len(attrs)))
return pd.Panel(data, items=symbols_, major_axis=dates, minor_axis=attrs)
然后我可以填充这样的初始数据:
def test_fresh_data():
data = create_blank_data()
for symbol in symbols.read():
data[symbol] = api(symbol, start='2010-01-01') # returns a Dataframe.
return data
这似乎有效,但是,我无法扩展数据。如果我加载的任何数据帧包含更新的数据,我想更新面板。目前,如果我使用另一个“data [symbol] = api(symbol,start ='2010-01-01')”行更新面板,则会忽略具有比面板中定义的更新日期的数据。我认为首先要明确扩展面板的日期范围。
我一直在使用this page as reference.