我使用的是datetime.date字段作为索引,但由于某种原因它似乎并不同意它是日期时间。
首先,我将确认该字段确实是datetime.date格式:
In [1]: df[date][0]
Out [1]: datetime.date(2010, 1, 1)
现在我尝试按周重新采样并绘制平均值:
In [2]: df.set_index(date)[var].resample('W', how='mean').plot()
/python2.7/site-packages/pandas/core/generic.pyc in resample(self, rule, how, axis, fill_method, closed, label, convention, kind, loffset, limit, base)
2878 fill_method=fill_method, convention=convention,
2879 limit=limit, base=base)
-> 2880 return sampler.resample(self).__finalize__(self)
2881
2882 def first(self, offset):
/python2.7/site-packages/pandas/tseries/resample.pyc in resample(self, obj)
100 return self.obj
101 else: # pragma: no cover
--> 102 raise TypeError('Only valid with DatetimeIndex or PeriodIndex')
103
104 rs_axis = rs._get_axis(self.axis)
TypeError: Only valid with DatetimeIndex or PeriodIndex
我无法提供样本数据,因为它是专有的。关于这里可能会发生什么的任何想法?
答案 0 :(得分:0)
我认为您希望首先将日期列转换为pandas时间序列。 试试:
df['date'] = pd.to_datetime(df.date)
df.set_index('date')[var]....
pandas dev告诉我,大熊猫指数中的datetime
个对象在可能的情况下应该避免效率低下。