首先,我是机器学习的新手,我可能会误解一些概念或其他事情,如果您这么想,请随时向我表示感谢。
我正在使用sklearn作为ML库,
假设我的数据有nrows和nfeatures:
ID time-interval feature1 feature2 feature3
1 10 0.10 0.11 0.23
1 20 0.15 0.22 0.17
1 30 0.23 0.58 0.01
2 40 0.27 0.12 0.07
2 50 0.78 0.65 0.15
2 60 0.12 0.17 0.78
3 70 0.22 0.19 0.01
3 80 0.76 0.68 0.25
3 90 0.14 0.14 0.38
这里,ID列不是一个功能,它只是将训练集与目标(解决方案)进行映射。
在二元分类上下文中,我需要预测目标,但是,每3个步骤我有1个目标
最后,预测将如下所示:
ID Targets
1 0
2 1
3 0
这只是意味着我有3个间隔来预测接下来三个时间间隔内发生的事情。
您如何处理这个时间序列问题?
例如如何使用数据每3个步骤进行一次预测。
更一般地说,如何使用多行进行一次预测?
我的第一个想法是通过对其进行整形来使算法包含包含3行原始数据的行(最后,它将要素数乘以3)。 但肯定不是最好的方法,因为结果不是很有预测性。
我的第二个想法是复制目标:
ID Targets
1 0
1 0
1 0
2 1
2 1
2 1
3 0
3 0
3 0
并使用原始数据逐行提供算法。 这还没有测试过。