根据这个问题How to get constant term in AR Model with statsmodels and Python?。我现在正试图使用ARMA模型来拟合数据,但我再也找不到解释模型结果的方法了。这是我根据ARMA out-of-sample prediction with statsmodels和ARMAResults.predict API document完成的工作。
# Parameter
INPUT_DATA_POINT = 200
P = 5
Q = 0
# Read Data
data = []
f = open('stock_all.csv', 'r')
for line in f:
data.append(float(line.split(',')[5]))
f.close()
# Fit ARMA-model using the first piece of data
result = arma_model(data[:INPUT_DATA_POINT], P, Q)
# Predict using model (fit dimension is len(data) + 1 why?)
fit = result.predict(0, len(data))
# Plot
plt.figure(facecolor='white')
plt.title('ARMA Model Fitted Using ' + str(INPUT_DATA_POINT) + ' Data Points, P=' + str(P) + ' Q=' + str(Q) + '\n')
plt.plot(data, 'b-', label='data')
plt.plot(range(INPUT_DATA_POINT), result.fittedvalues, 'g--', label='fit')
plt.plot(range(len(data)), fit[:len(data)], 'r-', label='predict')
plt.legend(loc=4)
plt.show()
这里的结果很奇怪,因为它应该与我在上面的链接中提到的上一个问题的结果几乎相同。另外,我不太明白为什么几个第一个数据点会有一些结果,因为它不应该是有效的(没有以前的计算值)。
我尝试编写自己的预测代码,如下所示(省略了与上述代码相同的顶部)
# Predict using model
start_pos = max(result.k_ar, result.k_ma)
fit = []
for t in range(start_pos, len(data)):
value = 0
for i in range(1, result.k_ar + 1):
value += result.arparams[i - 1] * data[t - i]
for i in range(1, result.k_ma + 1):
value += result.maparams[i - 1] * data[t - i]
fit.append(value)
# Plot
plt.figure(facecolor='white')
plt.title('ARMA Model Fitted Using ' + str(INPUT_DATA_POINT) + ' Data Points, P=' + str(P) + ' Q=' + str(Q) + '\n')
plt.plot(data, 'b-', label='data')
plt.plot(range(INPUT_DATA_POINT), result.fittedvalues, 'r+', label='fit')
plt.plot(range(start_pos, len(data)), fit, 'r-', label='predict')
plt.legend(loc=4)
plt.show()
这是我得到的最好结果
答案 0 :(得分:2)
您在模型的子集上训练模型,然后预测样本。 AR(MA)预测快速收敛到数据的均值。这就是你看到第一批结果的原因。在你的第二个结果中,你没有进行样本预测,你只是得到了样本外的拟合值。
使用卡尔曼滤波器递归拟合前几个观测数据点(这是完全最大似然估计与条件最大似然估计之间的区别)。
我会选择一本好的预测教科书并进行审核以了解这种行为。
答案 1 :(得分:0)
另一种可能的,可能更短的解决方案:
for i in range(0,len(data)):
fit.append(result.forecast()[0])
numpy.append(result.data.endog.data[i])