我有一个带有日期时间索引的数据框,其中的数据是不定期采样的(日期时间索引有间隙,即使没有间隙,样本之间的间距也有所不同)。
如果我这样做:
df ['my column']。autocorr(my_lag)
这行得通吗? autocorr知道如何处理不定期采样的日期时间数据吗?
答案 0 :(得分:0)
不太确定这里的“句柄”是什么意思,但是autocorr
并没有做任何特别的事情。实际上,它实际上是一种方便的方法,因为它等效于手动平移序列并获得其相关性。
In [3]: df.col.autocorr(lag=1) == df.col.corr(df.col.shift(1))
Out[3]: True
答案 1 :(得分:0)
这不是一个编程问题。
理想情况下,您的自相关度量将使用以两次观察之间的相同频率/相同时间间隔测量的数据。任何编程包中的任何autocorr函数都将简单地测量序列与所需滞后之间的相关性。不适用于不规则的频率。
您必须自己解决此问题,但是1)以固定的频率设置序列,2)将实际值映射到日期结构,3)在有缺口/ NaN的位置插值,然后4)运行您的autocorr。
长话短说,autocorr不会为您完成所有这些工作。
如果我误解了您担心的问题,请告诉我。了解更多有关采样频率的信息将很有帮助。我不得不处理很多这样的事情。