我正在使用包含时间戳记观察的两个月[2015年11月和12月]的大量时间序列数据。共有约600万个样本。我使用数据集中的干净数据部分来训练一类SVM。
这里要注意的是,我已相应地缩放和标准化数据,但我使用已处理的原始时间戳来训练它。在我训练了OCSVM之后 - 在我的测试数据上测试它并不能正常工作。结果非常不准确。
我认为的原因是因为我正在用时间戳训练它。但我是 不确定。
是否会建议预先处理并获得平均值 每小时然后训练它,而不是每次观察?
我一直试图在训练之前找到如何处理时间序列数据,但我无法找到任何数据。任何建议或参考论文将不胜感激
注意:我也在简历中提出了相同的问题。