我是时间序列分析的新手。我试图找到一个短(1天)温度时间序列的趋势,并尝试不同的近似值。此外,采样频率为2分钟。数据被分配给不同的站点。我将比较不同的趋势,看看它们是否相似。
我在这方面面临三个挑战:
Q1 - 我如何提取模式?
Q2 - 我如何量化这一趋势,因为我将比较趋势属于两个不同的地方?
问题3 - 我什么时候可以说两种趋势相似或不相似?
答案 0 :(得分:6)
Q1 - 我如何提取模式?
您首先要对两个数据集执行时间序列分析。您将需要一个统计库来进行测试和比较。
如果你可以使用Python,pandas
是个不错的选择。
在R中,forecast
包很棒。首先在两个数据集上运行ets
。
Q2 - 我如何量化趋势,因为我将比较趋势属于两个不同的地方?
量化趋势背后的想法是从寻找(线性)趋势线开始。所有统计数据包都可以帮助解决这个问题。例如,如果您假设线性趋势,那么最小化与数据点的平方偏差的线。
关于trend estimation的维基百科文章非常容易获取。 另外,请记住,趋势可以是线性的,指数的或阻尼的。可以尝试不同的趋势参数来处理这些。
问题3 - 我何时可以说两种趋势相似或不相似?
在两个数据集上运行ARIMA。 (这里的基本思想是查看同一组参数(构成ARIMA模型)是否可以描述你的临时时间序列。如果你在auto.arima()
(R)中运行forecast
,那么它将为您的数据选择参数p,d,q,非常方便。
另一个想法是对你的两个系列进行双样本t检验,并检查p值是否有显着性。 (警告:我不是统计学家,所以我不确定是否有任何理论反对时间序列这样做。)
在研究时,我遇到了Granger Test - 其基本思路是看一个时间序列是否有助于预测另一个时间序列。似乎非常适用于您的情况。
所以这些只是让你入门的几件事。希望有所帮助。