如何计算Timeseries DataFrame的概率?

时间:2018-04-04 14:46:25

标签: python machine-learning scikit-learn

我正在研究Timeseries DataFrame。这里我有XAUUSD的历史数据

            Date     Open     High      Low    Close
5008  2018-03-28  1345.66  1347.26  1323.94  1326.53
5009  2018-03-29  1326.81  1328.48  1322.02  1325.36
5010  2018-04-02  1326.91  1345.06  1326.13  1342.05
5011  2018-04-03  1341.86  1342.54  1329.53  1333.57
5012  2018-04-04  1333.48  1344.28  1331.77  1343.31

我想做的不是预测第二天的价格。我想获得下一天价格的概率列表(%)。

例如"高值可以达到最大值还是最小值?"或"低价值可以多少?"包含 %。让我们说它可以在1.0001% - 1.015%之间增加

我不确定使用哪种型号。我使用过LinearRegression,但它只是为了预测价格。所以这就是我需要的模型:

1. Train the past data
2. Get how much High away from yesterday's Close price (min/max)
3. Get how much High away from yesterday's Low price (min/max)
4. Sort values and show me all probabilities

你觉得这对任何sklearn模型都有可能吗?

1 个答案:

答案 0 :(得分:1)

你想要的是来自频率论模型的置信区间,或贝叶斯模型的后验均值和方差。

对于您的情况,您可以使用高斯过程来获得后验。这意味着,不是预测单个值,而是预测你的预期平均值,它也会给你一个后验的方差,你可以用它来看看自信模型是如何预测的结果

将这些模型拟合到一维数据(在您的情况下为低或高)是非常简单的,您可以很好地将它们可视化为您所看到的here

enter image description here

我最喜欢的高斯过程实现是GPy,但你可以使用你喜欢的任何一种。

我将同一个概念应用于您可以在here上阅读的其他问题。