我正在尝试创建用于预测多个相关时间序列特征的模型。 问题在于输入数据集由多个具有不同持续时间和不同类别数据的“项目”组成。
例如输入
+---------+-------------+----------------+-----------------+-----------------+----+----+----+
| Project | Week_number | Duration_weeks | Proj_metadata_1 | Proj_metadata_2 | A | B | C |
+---------+-------------+----------------+-----------------+-----------------+----+----+----+
| 1 | 1 | 3 | 121 | 1121 | 10 | 5 | 8 |
| 1 | 2 | 3 | 121 | 1121 | 12 | 2 | 5 |
| 1 | 3 | 3 | 121 | 1121 | 15 | 0 | 4 |
+---------+-------------+----------------+-----------------+-----------------+----+----+----+
| 2 | 1 | 6 | 121 | 5121 | 55 | 12 | 21 |
| 2 | 2 | 6 | 121 | 5121 | 35 | 8 | 18 |
| 2 | 3 | 6 | 121 | 5121 | 42 | 4 | 2 |
| 2 | 4 | 6 | 121 | 5121 | 15 | 1 | 1 |
| 2 | 5 | 6 | 121 | 5121 | 68 | 2 | 1 |
| 2 | 6 | 6 | 121 | 5121 | 27 | 6 | 0 |
+---------+-------------+----------------+-----------------+-----------------+----+----+----+
需要预测新的“项目”的“ A”,“ B”,“ C”时间序列,知道“ Duration_weeks”并考虑“ Proj_metadata”。
Google搜索了很多,尝试了双向LSTM,并与分类的嵌入式功能串联在一起,但尚未成功。
我正在考虑如何解决不同长度的输入“项目”(5..1000weeks)的问题以及如何正确应用分类项目数据。有没有好的做法?
感谢有关此主题的任何帮助或建议。