我以时间序列的方式获得了某些日期的数据点序列,并将缺少的日期添加到原始序列中。缺少的日期标记为0,原始日期标记为1。
在创建分类模型时,我试图预测每个将来日期的概率。我使用的功能仅基于日期(工作日,每月的周,季度开始,季度结束等)得出
我无法使用先前数据点可用的信息。天数的差异可能是重要的因素,但是添加日期将使其丢失。
寻找更好的建模方法,该方法也可以获取滞后的信息。
使用后勤/朴素贝叶斯分类器。
我以时间序列的方式获得了一些日期的数据点序列。 日期差异_天数 2018年1月1日NAN 100 2018年1月3日2天200 2018年1月5日2天150 2018年1月8日3天134
然后,我创建了缺少日期的数据并将其添加到原始系列中。
日期差_天数Y 2018年1月1日NAN 100 1 2018年1月2日NAN 0 0 2018年1月3日2天200 1 2018年1月4日NAN 0 0 2018年1月5日2天150 1 2018年1月6日NAN 0 0 2018年1月7日NAN 0 0 2018年1月8日3天134 1
寻找更好的方法来解决问题