将本地数据集加载到Python 3.4时间序列的Pandas statsmodel中

时间:2015-06-12 12:13:48

标签: python pandas time-series statsmodels

我正在尝试使用Pandas n statsmodels在Python中实现时间序列预测。我想读取本地excel文件数据,然后将其分解为Trends&季节性组件,但我无法获得任何相关链接,显示如何从本地驱动器加载数据。

我尝试使用以下代码:

    excel = pandas.ExcelFile( 'PET_PRI_SPT_S1_D.xls' )
    df = excel.parse( excel.sheet_names[1] )
    dta = sm.datasets.co2.load_pandas().data
    dta.co2.interpolate(inplace=True)
    res = sm.tsa.seasonal_decompose(dta.co2)
    resplot = res.plot()
    res.resid

但是如果我尝试打印 dta 变量,它会显示一些其他数据而不是 PET_PRI_SPT_S1_D.xls 。即使resplot = res.plot()似乎也不起作用,也没有出现情节。

请指导我如何将本地驱动器中的数据加载到pandas数据帧中。

编辑1:

当我尝试 df.info()时,我得到了关注。这里df是我的excel文件的对象。

DatetimeIndex:7509个条目,1986-01-24 00:00:00到2015-06-08 00:00:00数据列(共2列):WTI 7408非空对象布伦特7115非空对象dtypes:object(2)内存使用情况:117.3+ KB

当我尝试 dta.info(),其中dta是sm.datasets.co2类型的对象时,我得到了以下内容。

DatetimeIndex:2284个条目,1958-03-29 00:00:00到2001-12-29 00:00:00频率:W-SAT数据列(共1列):co2 2284非null float64 dtypes:float64(1)内存使用情况:35.7 KB

0 个答案:

没有答案