准备时间序列数据与用于机器学习的常规数据有什么区别

时间:2019-05-31 16:59:03

标签: computer-science

我不确定该如何询问或搜索它,任何关键字或概念都会受到赞赏。如果可以阐明这两种数据形式的本质差异,那就太好了。

1 个答案:

答案 0 :(得分:0)

通常,您将考虑标准化或标准化数据。标准化是在0-1之间重新调整数据,而标准化是将数据重新调整为正态分布。尽管后一种对新数据更健壮,但它需要先验知识,即您的数据遵循正态分布,这在许多情况下是不正确的。规范化要求您知道数据的最小值和最大值,但通常更适用于大多数情况。

对于时间序列数据,以上两种方法仍然适用,但是您首先要确保要处理固定数据。否则,从训练集中学习到的模型的“比例”可能不适用于推断。

时间序列数据还有另外两种方法:幂变换和差变换。

幂变换用于删除变化的方差。对数变换,Box-Cox变换和Yeo-Johnson变换是一些变体。

差异变换用于删除趋势或季节性。