我想测试一个时间序列上的平稳性(nobs = 23),并从statsmodels.tsa.stattools实现了adfuller测试。
以下是原始数据:
1995-01-01 3126.0
1996-01-01 3321.0
1997-01-01 3514.0
1998-01-01 3690.0
1999-01-01 3906.0
2000-01-01 4065.0
2001-01-01 4287.0
2002-01-01 4409.0
2003-01-01 4641.0
2004-01-01 4812.0
2005-01-01 4901.0
2006-01-01 5028.0
2007-01-01 5035.0
2008-01-01 5083.0
2009-01-01 5183.0
2010-01-01 5377.0
2011-01-01 5428.0
2012-01-01 5601.0
2013-01-01 5705.0
2014-01-01 5895.0
2015-01-01 6234.0
2016-01-01 6542.0
2017-01-01 6839.0
这是我正在使用的自定义ADF功能(贷方为此blog):
def test_stationarity(timeseries):
print('Results of Dickey-Fuller Test:')
dftest = adfuller(timeseries, autolag='AIC', maxlag = None)
dfoutput = pd.Series(dftest[0:4], index=['ADF Statistic', 'p-value', '#Lags Used', 'Number of Obs Used'])
for key, value in dftest[4].items():
dfoutput['Critical Value (%s)' % key] = value
print(dfoutput)
以下是对原始数据进行ADF测试的结果:
ADF Statistic -0.126550
p-value 0.946729
#Lags Used 8.000000
Number of Obs Used 14.000000
Critical Value (1%) -4.012034
Critical Value (5%) -3.104184
Critical Value (10%) -2.690987
ADF统计信息大于所有临界值,并且p值> alpha 0.05表示该序列不是平稳的,因此我对数据进行了一次差分。这是差分功能和ADF测试的结果:
def difference(dataset):
diff = list()
for i in range(1, len(dataset)):
value = dataset[i] - dataset[i - 1]
#print(value)
diff.append(value)
return pd.Series(diff)
ADF Statistic -1.169799
p-value 0.686451
#Lags Used 9.000000
Number of Obs Used 12.000000
Critical Value (1%) -4.137829
Critical Value (5%) -3.154972
Critical Value (10%) -2.714477
ADF统计信息和p值均得到改善,但是该序列仍然不稳定,因此我进行了第二次求差,再次得出以下结果:
ADF Statistic -0.000000
p-value 0.958532
#Lags Used 9.000000
Number of Obs Used 11.000000
Critical Value (1%) -4.223238
Critical Value (5%) -3.189369
Critical Value (10%) -2.729839
在对数据进行第二次差分之后,ADF测试统计信息变为-0.0000(考虑到未舍入值的print()返回-0.0,这令人感到困惑,但是两种方式都暗示着某处的有效位数不是零)。现在,p值比开始时差。我也收到此警告:
RuntimeWarning: divide by zero encountered in double_scalars
return np.dot(wresid, wresid) / self.df_resid.
对p,d,q值进行网格搜索将返回ARIMA(1,1,0)模型,但是我认为仍然需要第二次差分,因为第一次差分无法实现。
我怀疑奇怪的测试统计信息和p值是由于ADF测试的默认设置使用的样本量小和滞后次数过高(maxlag = None)。我知道当maxlag设置为None时,它将使用公式int(np.ceil(12。* np.power(nobs / 100。,1/4。)))。
这合适吗?如果不是这样,那么对于具有少量观察结果的数据集,或者在ADF函数中手动设置maxlag值的经验法则,是否有任何变通办法,可以避免出现看似错误的测试统计信息。我搜索了here,here和here,但找不到解决方案。
我正在使用statsmodels 0.8.0版。
答案 0 :(得分:0)
您看到的问题是最大滞后长度太高。首先,您的数据具有很强的趋势,因此您最初应该包括 trend="ct"
。这改善了检验统计量,但这还不够。当您不同时,差异数据具有非零均值,因此趋势应为“c”。这仍然不拒绝,因此需要双重差异。可能需要双重差异,因为序列是持久的,但也因为 ADF 测试的功效较低。
您应该将最大滞后设置为小于样本大小的平方根。这里发生的事情是使用了太多的滞后,这减少了有效样本量,因此模型拟合接近完美。这会产生大量被选择的滞后。
from arch.unitroot import ADF
import pandas as pd
import numpy as np
y = [3126.0, 3321.0, 3514.0, 3690.0, 3906.0, 4065.0, 4287.0,
4409.0, 4641.0, 4812.0, 4901.0, 5028.0, 5035.0, 5083.0,
5183.0, 5377.0, 5428.0, 5601.0, 5705.0, 5895.0, 6234.0,
6542.0, 6839.0]
y = pd.Series(y)
max_lags = int(np.sqrt(y.shape[0]))
print(f"max_lags: {max_lags}")
ADF(y, trend="ct", max_lags=max_lags).summary()
输出
max_lags: 4
Augmented Dickey-Fuller Results
=====================================
Test Statistic -2.009
P-value 0.596
Lags 2
-------------------------------------
Trend: Constant and Linear Time Trend
Critical Values: -4.50 (1%), -3.66 (5%), -3.27 (10%)
Null Hypothesis: The process contains a unit root.
Alternative Hypothesis: The process is weakly stationary.
接下来,区别,
ADF(y.diff().dropna(), trend="c", max_lags=max_lags).summary()
哪个返回
Augmented Dickey-Fuller Results
=====================================
Test Statistic -2.224
P-value 0.198
Lags 0
-------------------------------------
Trend: Constant
Critical Values: -3.79 (1%), -3.01 (5%), -2.65 (10%)
Null Hypothesis: The process contains a unit root.
Alternative Hypothesis: The process is weakly stationary.
null 不会被拒绝。再进行一次差分,这次与 trend="n"
,最终产生一个非常平稳的序列。
ADF(y.diff().diff().dropna(), trend="n", max_lags=max_lags).summary()
Augmented Dickey-Fuller Results
=====================================
Test Statistic -7.346
P-value 0.000
Lags 0
-------------------------------------
Trend: No Trend
Critical Values: -2.69 (1%), -1.96 (5%), -1.61 (10%)
Null Hypothesis: The process contains a unit root.
Alternative Hypothesis: The process is weakly stationary.
挑战在于,当时间序列很短时,不能完全依赖 ADF 测试。例如,这种差异看起来并不是特别不稳定。