我知道这可能是一个基本问题,但我想知道我是否在使用火车,请正确测试拆分。
说我有截至2019年的数据,我想预测未来5年的价值。
我的训练数据从1996-2014开始,我的测试数据从2014-2019开始。测试数据完全适合训练数据。然后,我使用此测试数据对2019-2024年进行了预测。
这是正确的方法吗,还是我的预测也应该像测试数据一样是2014-2019年?
答案 0 :(得分:1)
测试/验证数据对于您评估要使用的预测变量很有用。一旦确定了要使用的模型,就应该用整个数据集1996-2019训练模型,以免失去2014-2019年可能的有价值的知识。考虑到使用时间序列进行操作时,通常,在您的预测中,较新的序列比较早的序列更重要。