我正在研究二进制分类问题,如果每个数据实例都有几个不同指标的时间序列,那么还有其他一些属性。如何处理时间序列,将它们视为独立属性?但是这会丢失与时间维度相关的信息。
为了使其更具体,训练实例的示例将如下所示:
ID MetricA_Day1 MetricA_Day2 ..... MetricA_Day31 MetricB_Day1....MetricB_Day2 AttributeC AttributeD AttributeE
有关于如何处理此问题的最佳做法吗?
答案 0 :(得分:4)
首先,“通用”答案:不是,机器学习中没有最佳实践。事实上,只有坏的和目前流行的,但不是“最好的”。即使对于二进制,线性分类,它是否依赖于数据,是否更好地训练几何模型(SVM?)或概率模型。即使我们缩小到某个特定模型(简称神经网络),即使在数据缩放方面也没有最佳实践。它应该在[0,1]吗?或者[-1,1]?那么0和方差1怎么样?协方差矩阵是什么?
现在了解详细信息 - 您的问题几乎提供了有关数据的 no 信息。说“我有一些属性和很少的时间序列”远远没有给出真正有见地和有价值的答案的任何机会。但它看起来似乎不是一个具有任何确定答案的任务,它是一项长期研究任务。
您在研究期间可以搜索什么?