我开发了2个函数:一个需要一个不完整的时间序列,并填补空白,而另一个然后要完成此函数,然后创建滑动窗口数据集。
此转换的目的是将时间序列数据集转化为有监督的学习问题,以进行多步预测。
作为示例,起始数据集将类似于:
[1] Jan 2017 . Mar 2017 . May 2017 . Jul 2017 . Sep 2017
[2] 50 60 30 20 90
如果这是然后将所有缺失值都归零,那么 new 数据集将变为
[1] Jan 2017 . Feb 2017 . Mar 2017 . Apr 2017 . May 2017 . Jun 2017 . Jul 2017 . Aug 2017 . Sep 2017
[2] 50 0 60 0 30 0 20 0 90
(数据格式是宽格式还是长格式都没有关系。)
在多步骤监督学习问题中,需要将数据转换为滑动窗口的输入和输出。如果将上述内容转换为2输入:2输出数据集,则将创建6个组合:
[input], [output]
[50, 0], [60, 0]
[0, 60], [0, 30]
[60, 0], [30, 0]
[0, 30], [0, 20]
[30, 0], [20, 0]
[0, 20], [0, 90]
问题: 在必须创建组合之前 ,如何确定此过程将生成的组合总数?