我正在处理一个每两个月一次的数据,在此我可以为客户提供客户的销售额。我试图在python中绘制原始系列,并绘制
import matplotlib.pyplot as plt
Cust_bimonthly_Data['Customer_Sales'].plot(figsize=(12, 8))
plt.title('Cust Bimonthly Daily')
plt.show()
我试图用Python绘制上述时间序列,看起来像这样
为了消除数据中的这个大峰,这是一个离群值,我对数据进行了log(x + 1)转换,即将所有值都增加到1,然后进行了对数转换
Cust_bimonthly_Data['new_Customer_Sales'] = Cust_bimonthly_Data['new_Customer_Sales']+1
Cust_bimonthly_Data['log_cust_sales']=np.log(Cust_bimonthly_Data['new_Customer_Sales'])
**对数转换系列看起来像这样**
为了检查日志转换后的数据是否固定,我进行了ADF测试,这就是我的结果
from statsmodels.tsa.stattools import adfuller
Cust_bimonthly_Data_test= Cust_bimonthly_Data_drop.iloc[:,0].values
result = adfuller(Cust_bimonthly_Data_test)
(-4.8014847417664424,
5.4031369234729222e-05,
0,
63,
{'1%':-3.5386953618719676,
'10%':-2.591896782564878,
'5%':-2.9086446751210775},
150.10425215395222)
由于该测试拒绝了我的序列不是平稳的原假设,因此我仍然应该继续进行分解和微分部分。我的意思是说所有这些事情仍将是必需的,因为我可以看到测试告诉我我的系列现在是静止的