我不确定该如何询问或搜索它,任何关键字或概念都会受到赞赏。如果可以阐明这两种数据形式的本质差异,那就太好了。
答案 0 :(得分:0)
通常,您将考虑标准化或标准化数据。标准化是在0-1之间重新调整数据,而标准化是将数据重新调整为正态分布。尽管后一种对新数据更健壮,但它需要先验知识,即您的数据遵循正态分布,这在许多情况下是不正确的。规范化要求您知道数据的最小值和最大值,但通常更适用于大多数情况。
对于时间序列数据,以上两种方法仍然适用,但是您首先要确保要处理固定数据。否则,从训练集中学习到的模型的“比例”可能不适用于推断。
时间序列数据还有另外两种方法:幂变换和差变换。
幂变换用于删除变化的方差。对数变换,Box-Cox变换和Yeo-Johnson变换是一些变体。
差异变换用于删除趋势或季节性。