答案 0 :(得分:0)
诸如“什么是最好的方法……”之类的问题在机器学习中根本上是不正确的。如果我们假设一个模型的参数很少且数据分布不均,那么我们可以争论一个估计量的方差,甚至可以计算它,但是由于我们不知道数据在现实生活中的分布情况,因此无法争论最优性。
直接解决您的问题,您没有指定数据的保存方式,文件类型,结构,大小等。您缺少许多可以帮助我们的详细信息。此外,我知道只有少数情况不需要进行数据准备,而且所有这些都是国际著名的数据集(例如MNIST和其他一些较早的比赛)。您需要并且应该准备好数据,然后再将其提供给网络。此外,您应该尝试不同的方法(对其进行归一化等),并在保留集(验证)上评估性能,以查看哪种更好。您可以尝试使用torchvision.transforms
来分隔它们,即使它不是视觉任务。这是强大的预处理管道。
最终,您还应该尝试使用不同的体系结构和单元,因为时间序列深度学习在过去几年中取得了显着进展(从变异辍学到卷积和注意力单元)。