如何以日期时间作为索引并为需求预测提供一个分类值,以准备到RNN LSTM网络的输入? 我有800个数据点,我的数据格式为:
Date Demand Holiday
1/2/2015 203 0
1/5/2015 370 0
1/6/2015 8 1
1/7/2015 388 0
1/8/2015 19 1
1/9/2015 376 0
1/12/2015 343 0
1/13/2015 430 1
请提出建议。
Date Demand Holiday
1/2/2015 203 0
1/5/2015 370 0
1/6/2015 8 1
1/7/2015 388 0
1/8/2015 19 1
1/9/2015 376 0
1/12/2015 343 0
1/13/2015 430 1
答案 0 :(得分:0)
首先,应分解“日期”列(例如:星期几,一年中的某周,某年)。然后,作为最佳实践,您应该考虑使用极坐标表示(cos,sin)或简单地使用虚拟表示(单次热编码)对循环特征进行编码。 最后,您只需要构建LSTM模型(可能是顺序的),并非常注意如何定义模型的输入/输出形状。
答案 1 :(得分:0)
根据您发布的样本,您的数据缺少某些日期。通常,我建议采用某种形式的平滑或插值,但是您的数据非常怪异且块状(370,然后是8,然后是388),因此平滑或插值将不起作用。它也似乎与假期没有任何有意义的联系。因此,在考虑LSTM或RNN之前,我会先考虑清理或改善您的数据。