跨不同持续时间的多个数据集训练的时间序列预测模型

时间:2020-05-14 12:09:14

标签: time-series lstm forecasting

我正在尝试创建用于预测多个相关时间序列特征的模型。 问题在于输入数据集由多个具有不同持续时间和不同类别数据的“项目”组成。

例如输入

+---------+-------------+----------------+-----------------+-----------------+----+----+----+
| Project | Week_number | Duration_weeks | Proj_metadata_1 | Proj_metadata_2 | A  | B  | C  |
+---------+-------------+----------------+-----------------+-----------------+----+----+----+
|       1 |           1 |              3 |             121 |            1121 | 10 |  5 |  8 |
|       1 |           2 |              3 |             121 |            1121 | 12 |  2 |  5 |
|       1 |           3 |              3 |             121 |            1121 | 15 |  0 |  4 |
+---------+-------------+----------------+-----------------+-----------------+----+----+----+
|       2 |           1 |              6 |             121 |            5121 | 55 | 12 | 21 |
|       2 |           2 |              6 |             121 |            5121 | 35 |  8 | 18 |
|       2 |           3 |              6 |             121 |            5121 | 42 |  4 |  2 |
|       2 |           4 |              6 |             121 |            5121 | 15 |  1 |  1 |
|       2 |           5 |              6 |             121 |            5121 | 68 |  2 |  1 |
|       2 |           6 |              6 |             121 |            5121 | 27 |  6 |  0 |
+---------+-------------+----------------+-----------------+-----------------+----+----+----+

需要预测新的“项目”的“ A”,“ B”,“ C”时间序列,知道“ Duration_weeks”并考虑“ Proj_metadata”。

Google搜索了很多,尝试了双向LSTM,并与分类的嵌入式功能串联在一起,但尚未成功。

我正在考虑如何解决不同长度的输入“项目”(5..1000weeks)的问题以及如何正确应用分类项目数据。有没有好的做法?

感谢有关此主题的任何帮助或建议。

0 个答案:

没有答案