在训练我的预测变量时,我遇到了这个错误,并且卡住了解决方法。
我有两个数据系列,一个有9234行的“目标时间序列数据”和一个“ item_id”,另一个是“相关时间序列数据”,其行数与我只有一个ID。
我正在设置180天的数据窗口,错误中出现的第二个和第一个数字之间的确切区别是9414-9234 = 180。
We were unable to train your predictor.
Please ensure there are no missing values for any items in the related time series, All items need data until 2020-03-15 00:00:00.0. For example, following items have missing data: item: brl only has 9234/9414 required datapoints starting 1994-06-07 00:00:00.0, please refer to documentation for additional details.
一旦我的数据没有丢失的数据,并且每天都会为什么返回此错误? 我的数据开始于1994-06-07,结束于2019-09-17。为什么我应该有9414个数据点而不是9234个数据点? 我应该在“目标时间序列数据”中删除180天吗?
答案 0 :(得分:1)
必须知道相关时间序列数据的未来值。
良好的相关时间序列示例:您知道过去和将来的日子,行销活动已经或将要发送电子邮件时事通讯来宣传您要预测的产品。您可以将此数据用作相关时间序列。
相关时间序列不正确的示例:您注意到Google搜索与您的产品销售相关的品牌。结果,您要将其用作相关时间序列。由于您不知道将来会进行多少次搜索,因此您不能将其用作相关的时间序列。
在这种情况下,您拥有9414天的TARGET_TIME_SERIES数据,并且希望预测接下来180天的需求。这意味着您的RELATED_TIME_SERIES数据应为9594天。
编辑:我尚未使用亚马逊的预测产品对此进行测试。我的答案基于与Facebook Prophet(这是亚马逊预测使用的模型之一)合作的基础。请让我知道我的解决方案是否有效。