延长熊猫时间序列

时间:2014-01-18 11:25:44

标签: python pandas panel time-series

我想在使用新数据进行更新时扩展pandas时间序列。以下是我为股票数据创建初始Panel的方法。这是最初的空面板:

def create_blank_data():
    dates = pd.date_range(start=dt.date(2008, 1, 1), end=dt.date.today())
    attrs = ['Open', 'High', 'Low', 'Close', 'Volume', 'Adj Close']
    symbols_ = symbols.read()
    data = np.zeros((len(symbols_), len(dates), len(attrs)))
    return pd.Panel(data, items=symbols_, major_axis=dates, minor_axis=attrs)

然后我可以填充这样的初始数据:

def test_fresh_data():
    data = create_blank_data()
    for symbol in symbols.read():
        data[symbol] = api(symbol, start='2010-01-01') # returns a Dataframe.
    return data

这似乎有效,但是,我无法扩展数据。如果我加载的任何数据帧包含更新的数据,我想更新面板。目前,如果我使用另一个“data [symbol] = api(symbol,start ='2010-01-01')”行更新面板,则会忽略具有比面板中定义的更新日期的数据。我认为首先要明确扩展面板的日期范围。

我一直在使用this page as reference.

0 个答案:

没有答案