我正在尝试使用Pandas n statsmodels在Python中实现时间序列预测。我想读取本地excel文件数据,然后将其分解为Trends&季节性组件,但我无法获得任何相关链接,显示如何从本地驱动器加载数据。
我尝试使用以下代码:
excel = pandas.ExcelFile( 'PET_PRI_SPT_S1_D.xls' )
df = excel.parse( excel.sheet_names[1] )
dta = sm.datasets.co2.load_pandas().data
dta.co2.interpolate(inplace=True)
res = sm.tsa.seasonal_decompose(dta.co2)
resplot = res.plot()
res.resid
但是如果我尝试打印 dta 变量,它会显示一些其他数据而不是 PET_PRI_SPT_S1_D.xls 。即使resplot = res.plot()似乎也不起作用,也没有出现情节。
请指导我如何将本地驱动器中的数据加载到pandas数据帧中。
编辑1:
当我尝试 df.info()时,我得到了关注。这里df是我的excel文件的对象。
DatetimeIndex:7509个条目,1986-01-24 00:00:00到2015-06-08 00:00:00数据列(共2列):WTI 7408非空对象布伦特7115非空对象dtypes:object(2)内存使用情况:117.3+ KB
当我尝试 dta.info(),其中dta是sm.datasets.co2类型的对象时,我得到了以下内容。
DatetimeIndex:2284个条目,1958-03-29 00:00:00到2001-12-29 00:00:00频率:W-SAT数据列(共1列):co2 2284非null float64 dtypes:float64(1)内存使用情况:35.7 KB