应用错误收集

时间：2009-12-29 07:03:50

标签： time-series data-manipulation

我需要编写一个程序，在不同日期范围（主要是2007-2009）和频率（每周，每月，每年......）的倍数时间序列上执行算术（+ - * /）。

我想出了：

如何以最有意义的方式呈现数据？

尝试考虑所有可能性

答案 0 :(得分：2)

如果零可以是此时间序列的有意义值（例如，以摄氏度为单位的温度），则用零填充所有间隙可能不是一个好主意（即，您将无法区分实数和存根值然后）。你可能希望interpolate你的时间序列。这个的基本数据结构可以是数组/双链表。

答案 1 :(得分：1)

您可以采取以下几种方法：

您应该始终了解您的数据，因为：

一旦你拥有所有时间序列的相同时标，你就可以执行算术魔法，但要注意插值会产生额外的信息，而摘要会删除可用的信息。

答案 2 :(得分：1)

我已经相当广泛地研究了这个问题。插值方法的危险在于你偏向各种测量 - 特别是波动 - 并引入虚假相关。我发现傅立叶插值在一定程度上减轻了这种情况，但更好的方法是采用另一种方式：聚合更频繁的观察以匹配不太频繁的序列的周期性，然后比较这些。