我遇到一个有关在“时间序列”任务中将数据分为训练和测试集的问题。 我知道数据不能被改组,因为它对于保持数据的时间特性很重要,因此我们不会创建能够展望未来的方案。 但是,当我对数据进行混洗(用于实验)时,我得到的R-Squared分数高得离谱。 是的,使用测试集评估R平方。有人可以简单解释为什么会这样吗?为什么按时间序列改组训练和测试数据会产生较高的R-Squared分数?我的猜测是,它与时间序列的趋势有关,但我不确定。我只是出于好奇而问,谢谢!
答案 0 :(得分:0)
这实际上取决于您的问题。如果:
希望这会有所帮助!