使用熊猫时间序列进行在线回溯测试

时间:2019-08-14 21:10:16

标签: python pandas time-series

设计问题,请让我知道这里是否有问题。

我有一个时间序列数据,我想预测下一个元素。我需要设计2个系统-在线生产系统,该系统可以预测直到当前时刻的所有历史记录的下一个元素,以及一个回测系统,该系统可以滚动已知的历史记录,预测每个时间点的下一个元素并测量准确性(与backtesting.py)。

我的预测始终基于一天中同一小时的前10个元素的平均值。

现在假设我在两个系统上都使用了pandas系列(在线时它将提供一些kafka队列,而在回测中它将仅从csv中读取)。如何为两者使用大致相同的方法?似乎在回测中,我需要使用一种rolling方法(例如df.groupby(df['date'].dt.hour).rolling(10).mean()),而在在线中,我需要每隔X分钟重建一次系列,然后仅对最后一个相关的片段进行切片我的预测数据(例如df[(df['date'] > now() - 10) & (df['date'].hour == cur_time)].mean())

这是应该工作的方式吗?是否有一些已知的方法或设计模式可以让我在回测和在线系统中使用相同的代码?

0 个答案:

没有答案