用于ARTXP时间序列预测算法和ARTXP理论的Python代码

时间:2013-02-27 20:50:15

标签: python algorithm tree data-mining time-series

问题:连续变量值随时间推移的模型演变。

我通过一篇论文介绍了一种预测时间序列下一个值的方法。 ARIMA模型对于长期预测更准确,而ARTXP模型更倾向于推断下一个值。

用于数据挖掘算法的Microsoft库实现了ARTXP,它是自回归树模型的一种变体。

算法如何运作?你有这个模型的Python实现吗?

1 个答案:

答案 0 :(得分:1)

我们可以参考this paper,并在下面的说明中总结方法。

时间序列模型

给定变量的时间序列, enter image description here,时间序列是这些变量的值序列enter image description here。如果enter image description here是概率分布或模型,我们将其限制为具有

形式的模型

enter image description here

模型是概率的,静止的,​​并且具有p-Markov属性。

自回归树模型

首先, AR模型的格式为

enter image description here

其中enter image description here是正态分布,带有明显的符号。

也就是说,每次,值的概率意味着“自动回归地”依赖于该系列的最后p值。

ART模型是分段线性的AR模型,因此可以表示为树。每个非叶子是布尔公式,每个叶子是AR模型。

这很简单:沿树的分支操作取决于系列的过去值。然后每个叶子是用于预测下一个时间序列值的AR模型。

AR模型是退化的ART模型,其中存在一个“布尔”决策节点和一个叶子AR模型。