pandas autocorr可以不定期地处理时间序列数据采样吗?

时间:2019-10-25 15:15:17

标签: python pandas autocorrelation

我有一个带有日期时间索引的数据框,其中的数据是不定期采样的(日期时间索引有间隙,即使没有间隙,样本之间的间距也有所不同)。

如果我这样做:

df ['my column']。autocorr(my_lag)

这行得通吗? autocorr知道如何处理不定期采样的日期时间数据吗?

2 个答案:

答案 0 :(得分:0)

不太确定这里的“句柄”是什么意思,但是autocorr并没有做任何特别的事情。实际上,它实际上是一种方便的方法,因为它等效于手动平移序列并获得其相关性。

In [3]: df.col.autocorr(lag=1) == df.col.corr(df.col.shift(1))                                                                                                                      
Out[3]: True

答案 1 :(得分:0)

这不是一个编程问题。

理想情况下,您的自相关度量将使用以两次观察之间的相同频率/相同时间间隔测量的数据。任何编程包中的任何autocorr函数都将简单地测量序列与所需滞后之间的相关性。不适用于不规则的频率。

您必须自己解决此问题,但是1)以固定的频率设置序列,2)将实际值映射到日期结构,3)在有缺口/ NaN的位置插值,然后4)运行您的autocorr。

长话短说,autocorr不会为您完成所有这些工作。

如果我误解了您担心的问题,请告诉我。了解更多有关采样频率的信息将很有帮助。我不得不处理很多这样的事情。