通过使用日期和小时进行分组来创建时间序列

时间:2019-03-17 21:51:53

标签: python pandas time-series

我有一个看起来像这样的数据框

    FROM mongo
    RUN mkdir -p /app/data
    WORKDIR /app/data
    COPY gene.csv /app/data
    COPY script.sh /app/data
    CMD ["mongod", "&&", "mongoimport", "-d", "Gene", "-c", "Genes", "--file", "gene.csv", "--headerline"]

我正在尝试根据四列对数据框进行分组,并希望输出看起来像这样

  START_DATE    END_DATE  START_HOUR  END_HOUR  CURTAILED_OTC_MW
0  04-11-2015  31-10-2016         1.0      18.0             700.0
1  04-11-2015  31-10-2016         1.0      18.0             700.0
2  30-01-2016  30-01-2016         5.0      14.0             708.0
3  30-01-2016  30-01-2016        15.0      18.0             658.0
4  04-11-2015  31-03-2016         1.0      24.0            1368.0
5  04-11-2015  31-03-2016         1.0      24.0            1368.0

当我尝试使用START_DATE END_DATE START_HOUR END_HOUR CURTAILED_OTC_MW 0 04-11-2015 31-10-2016 1.0 18.0 1400.0 1 30-01-2016 30-01-2016 5.0 14.0 1364.0 2 04-11-2015 31-03-2016 1.0 24.0 2736.0 时,会显示以下输出

groupby

我如何基于此为2016年的每一天创建一个时间序列,该时间序列将具有2016年的每一小时,然后是该小时的MW值?

例如,对于01/01/2016

g = data.groupby(['START_DATE','END_DATE','START_HOUR','END_HOUR']).sum()

                                       CURTAILED_OTC_MW
START_DATE END_DATE   START_HOUR END_HOUR                  
01-01-2002 31-01-2020 1.0        24.0              200187.0
01-01-2011 31-01-2020 1.0        19.0               91000.0
                                 24.0              182000.0
01-01-2016 01-01-2016 6.0        14.0                9937.0
                                 16.0               19874.0

0 个答案:

没有答案