我理解将数据分成培训和测试提供了一种评估模型与看不见的数据的效果的方法。
我正在训练ARIMA模型,我从10月1日到11月22日有每日数据。我有兴趣在12月14日预测一些指标。我
我希望我的问题有道理,很高兴澄清你是否觉得这令人困惑。
谢谢!
答案 0 :(得分:0)
如果您使用所有数据进行培训,那么您将无法预测将通用模型设置为看不见数据的程度。这是不使用测试集的一个问题。
您将遇到的另一个问题是,除非您决定进行交叉验证,否则您将无法尝试不同的配置或模型超参数。
数据序列预测对于交叉验证特别棘手,但我会遵循关于正向链接的this post's建议。如果您有6周的数据,则可以按如下方式将数据拆分为折叠: