我已经对包含小时和日期的数据使用数据透视,如下所示:
data_hourly = dfdt.resample('H').sum()
data_hourly['hour'] = data_hourly.index.hour
data_hourly.index = data_hourly.index.date
kWh hour
2016-06-07 2223160 22
2016-06-07 2223274 23
2016-06-08 2223367 0
2016-06-08 2223449 1
data_pivot = data_hourly.pivot(columns='hour', values = 'kWh')
hour 0 1
2016-06-08 2,223,367 2,223,449
2016-06-09 2,231,500 2,231,581
正如您所见,它正在工作。现在,我试图用几周的时间做同样的事情,但是即使我做的所有事情都一样,它也无法正常工作。
data_day_akt = data_day_akt.resample('D').sum()
data_day_akt['day'] = data_day_akt.index.dayofweek
data_day_akt.index = data_day_akt.index.year.values*1000+data_day_akt.index.week.values
kWh day
2016037 279,872 5
2016037 202,368 6
2016038 977,600 0
2016038 999,136 1
data_pivot = data_day_akt.pivot(columns='day', values = 'kWh')
但是这一次抛出
ValueError: Index contains duplicate entries, cannot reshape
有人知道为什么会这样吗?第一次,索引是日期时间对象,第二次不是。这可能是原因吗?