问题描述:预测CPU利用率 方法:使用时间序列算法。
第1步:从Elasticsearch收集了1000个观察结果并在Python上导出。
第2步:绘制数据并检查数据是否静止。
第3步:使用日志将数据转换为固定格式。
第4步:完成DF测试,ACF和PACF。
第5步:构建ARIMA(3,0,2)
模型。
第6步:预测。
我构建了ARIMA (3,0,2)
时间序列模型但无法找到模型的准确性。是否有任何命令可以通过它来检查Python中模型的准确性?
如果我的方法是否正确以及如何在Python中找到模型的准确性,请指点一下吗?
答案 0 :(得分:0)
我一直在对此进行一些研究,遗憾的是,我在python中找不到关于score
的{{1}}函数。我建议您按照之前site的回答推荐此post。
此外,正如答案中所述,“statsmodels确实具有连续因变量的性能指标。”
希望有些极客可以找到并回答,如果我发现任何相关内容,我一定会把它发布到社区。
答案 1 :(得分:0)
方法正确与否-
我希望您能从ACF和PACF中找到最佳的P,Q值。 python中有github代码,可以像自动Arima(自动找到最佳参数)一样工作,因此您不必担心P,q值。基本上取P,Q值,其中模型的BIC最小。
Pyhton代码-
有三个主要指标可用于评估线性模型。它们是:平均绝对误差(MAE),均方误差(MSE)或均方根误差(RMSE)。
MAE :最容易理解。代表平均误差
MSE :与MAE相似,但噪声被夸大,较大的错误被“惩罚”。与MAE相比,它更难解释,因为它不在基本单位内,但是通常更受欢迎。
RMSE :最受欢迎的指标,与MSE相似,但其结果是平方根的,因此它以基本单位为单位时更具解释性。建议将RMSE用作解释模型的主要指标。
下面,您将看到如何计算每个指标。它们全部都需要两个列表作为参数,一个是您的预测值,另一个是真实值-