我是使用python pandas的新手,并使用以下脚本从excel文件中提取时间序列数据,设置dates = index,然后希望对按日期引用的数据执行各种计算。脚本:
df = pd.read_excel("myfile.xls")
df = df.set_index(df.Date)
df = df.drop("Date",1)
df.index.name = None
df.head()
该输出(为了让您了解数据)是:
Px1 Px2 Px3 Px4 Px5 Px6 Px7
2015-08-12 19.850000 10.25 7.88 10.90 109.349998 106.650002 208.830002
2015-08-11 19.549999 10.16 7.81 10.88 109.419998 106.690002 208.660004
2015-08-10 19.260000 10.07 7.73 10.79 109.059998 105.989998 210.630005
2015-08-07 19.240000 10.08 7.69 10.92 109.199997 106.430000 207.919998
2015-08-06 19.250000 10.09 7.76 10.96 109.010002 106.010002 208.350006
当我尝试根据df.loc['20150806']
这样的日期检索数据时,但当我尝试检索df.loc['20150806':'20150812']
之类的切片时,我会返回Empty DataFrame
。
同样,索引是一个DateTimeIndex,其中dtype ='datetime64 [ns]',length = 1412,freq = None,tz = None
就像我说的,我的最终目标是能够按日,月,年,不同时期等对数据进行分组,并对数据进行计算。我想提供这样的背景,但是甚至不想进入那里,因为我显然已经陷入了一些更基本的东西 - 可能误解了如何使用DateTimeIndex进行操作
谢谢。
编辑:还要包括,我认为我用索引引用的主要问题与freq = 0有关,bc当我尝试使用连续日期系列的简单示例时,我没有遇到这个问题。