我有一个看起来像这样的数据框
FROM mongo
RUN mkdir -p /app/data
WORKDIR /app/data
COPY gene.csv /app/data
COPY script.sh /app/data
CMD ["mongod", "&&", "mongoimport", "-d", "Gene", "-c", "Genes", "--file", "gene.csv", "--headerline"]
我正在尝试根据四列对数据框进行分组,并希望输出看起来像这样
START_DATE END_DATE START_HOUR END_HOUR CURTAILED_OTC_MW
0 04-11-2015 31-10-2016 1.0 18.0 700.0
1 04-11-2015 31-10-2016 1.0 18.0 700.0
2 30-01-2016 30-01-2016 5.0 14.0 708.0
3 30-01-2016 30-01-2016 15.0 18.0 658.0
4 04-11-2015 31-03-2016 1.0 24.0 1368.0
5 04-11-2015 31-03-2016 1.0 24.0 1368.0
当我尝试使用START_DATE END_DATE START_HOUR END_HOUR CURTAILED_OTC_MW
0 04-11-2015 31-10-2016 1.0 18.0 1400.0
1 30-01-2016 30-01-2016 5.0 14.0 1364.0
2 04-11-2015 31-03-2016 1.0 24.0 2736.0
时,会显示以下输出
groupby
我如何基于此为2016年的每一天创建一个时间序列,该时间序列将具有2016年的每一小时,然后是该小时的MW值?
例如,对于01/01/2016
g = data.groupby(['START_DATE','END_DATE','START_HOUR','END_HOUR']).sum()
CURTAILED_OTC_MW
START_DATE END_DATE START_HOUR END_HOUR
01-01-2002 31-01-2020 1.0 24.0 200187.0
01-01-2011 31-01-2020 1.0 19.0 91000.0
24.0 182000.0
01-01-2016 01-01-2016 6.0 14.0 9937.0
16.0 19874.0