Python中的时间序列分类问题

时间:2019-02-23 18:03:24

标签: python pytorch

我的数据集看起来像这样。如何将其提供给RNN模型。我应该为每个用户提取每小时的值作为一项功能并将其提供给RNN,还是可以像现在这样直接提供数据。谢谢

1 个答案:

答案 0 :(得分:0)

诸如“什么是最好的方法……”之类的问题在机器学习中根本上是不正确的。如果我们假设一个模型的参数很少且数据分布不均,那么我们可以争论一个估计量的方差,甚至可以计算它,但是由于我们不知道数据在现实生活中的分布情况,因此无法争论最优性。

直接解决您的问题,您没有指定数据的保存方式,文件类型,结构,大小等。您缺少许多可以帮助我们的详细信息。此外,我知道只有少数情况不需要进行数据准备,而且所有这些都是国际著名的数据集(例如MNIST和其他一些较早的比赛)。您需要并且应该准备好数据,然后再将其提供给网络。此外,您应该尝试不同的方法(对其进行归一化等),并在保留集(​​验证)上评估性能,以查看哪种更好。您可以尝试使用torchvision.transforms来分隔它们,即使它不是视觉任务。这是强大的预处理管道。

最终,您还应该尝试使用不同的体系结构和单元,因为时间序列深度学习在过去几年中取得了显着进展(从变异辍学到卷积和注意力单元)。