我有3个月的时间序列数据,间隔15分钟。 (一天有96个时隙) 我有温度列[Temp]和太阳辐照度[SI](太阳强度)列。 我的模型必须在一天内“提前”预测温度。即我必须预测到前一天的数据有96个时隙。 当我“自己”评估模型并将数据拆分为训练集和测试集时。我如何拆分它们? 我会做80:20的拆分吗?但我的测试数据将有超过一天的读数。 还是我做一个(3个月-1天)->火车,只在最后一天进行测试?
答案 0 :(得分:1)
实际上,这取决于您的任务。但是强烈建议不要在火车集中混合新旧数据。
有些链接可能对您有用:
http://francescopochetti.com/pythonic-cross-validation-time-series-pandas-scikit-learn/
https://stats.stackexchange.com/questions/117350/how-to-split-dataset-for-time-series-prediction