我想预测一些数据(假设国家温度)。是否有任何方法可以在deepAR(AWS Sagemaker市场上提供的算法)中一次添加多个国家的温度,然后deepAR独立地对其进行预测?是否可以删除特定的国家/地区数据,几天后再添加?
我是Forecasting的新手,想尝试deepAR。如果有人对此进行过工作,请提供一些有关如何使用deepAR进行操作的指导原则
链接-https://docs.aws.amazon.com/sagemaker/latest/dg/deepar.html
答案 0 :(得分:1)
这是对此信息的最新回复,但我的回复将来可能会对其他人有所帮助。您第一个问题的答案是肯定的。
您链接到的页面引用了cat
字段,这使您可以编码代表不同记录组的向量。在您的情况下,cat字段可以只是一个值,但是cat字段也可以在向量中具有更多维的情况下对更复杂的关系进行编码。
假设您要对3个国家/地区进行预测。您具有每个国家/地区的一些时间序列温度训练数据,然后将其作为行输入到火车JSON文件中,如下所示:
国家1:
{"start": "02/09/2019 00:00:00", "target": [T1,T2,T3,T4,...], "cat": [0]}
国家2:
{"start": "02/09/2019 00:00:00", "target": [T1,T2,T3,T4,...], "cat": [1]}
国家3:
{"start": "02/09/2019 00:00:00", "target": [T1,T2,T3,T4,...], "cat": [2]}
类别字段向DeepAR指示这些是独立的数据类别,即不同的国家/地区。
所有数据的频率(两次温度测量之间的时间)必须相同,但是开始时间和训练点数不相同。
训练完模型后,打开端点并要对某个国家/地区进行预测,您可以传递特定国家/地区的上下文以及与上述国家之一相同的cat
。
这样,您就可以创建一个模型,从而可以从许多独立的数据组中进行预测。
我不确定第二个问题是什么意思。如果您打算稍后再为另一个国家/地区添加更多的培训数据,则需要您为该国家/地区创建具有其他类别的其他培训数据集,然后重新训练模型。