使用Grouper

时间:2018-05-01 21:34:11

标签: python-3.x pandas dataframe

我有一个数据框,其中一列是时间戳。 例如:

                week                     Energy        Value
1152 2018-01-09 00:00:00                  None        0.000000   
1153 2018-01-09 00:10:00                  None        0.000000   
1154 2018-01-09 00:20:00                  None      104.000000   
1155 2018-01-09 00:30:00                  None      104.049080   
1156 2018-01-09 00:40:00                  None        0.000000   
1157 2018-01-09 00:50:00                  None        0.000000   
1158 2018-01-09 01:00:00                  None       46.428571   
1159 2018-01-09 01:10:00                  None        0.000000   
1160 2018-01-09 01:20:00                  None        0.000000   
1161 2018-01-09 01:30:00                  None      113.846154   
1162 2018-01-09 01:40:00                  None      126.108374   
1163 2018-01-09 01:50:00                  None        0.000000   
1164 2018-01-09 02:00:00                  None       35.398230   
1165 2018-01-09 02:10:00                  None        0.000000   
1166 2018-01-09 02:20:00                  None        0.000000   
1167 2018-01-09 02:30:00                  None       71.937984   
1168 2018-01-09 02:40:00                  None        0.000000   
1169 2018-01-09 02:50:00                  None        0.000000   
1170 2018-01-09 03:00:00                  None       30.877193   
1171 2018-01-09 03:10:00                  None        0.000000 

现在,我使用pd.Grouper将其分组到该列,但它返回与分组周期的 end 对应的日期时间。这是我的查询

df = df.groupby([pd.Grouper(key=timestamp, freq='W'), 'ID'])

返回:

week                   Count      
2018-01-07               984  
2018-01-14               566  
2018-01-21               725  
2018-01-28               815  
2018-02-04               774  
2018-02-11               648  
2018-02-18               807  
2018-02-25               804  
2018-03-04               967  
2018-03-11               953

这已经非常令人困惑,因为使用freq='W'会在星期日返回常规星期一到星期一星期,即星期结束,而不是星期开始< / em>在星期天,正如我假设的那样。当然,the documentation没有任何意义,因为所有它都表示每周频率(星期日)&#34;。

我的主要问题是,如何让时间戳列(分组后)返回与句点 start 对应的时间戳?这是必要的,因为我需要将此数据帧与使用pd.date_range(start, end, freq='W-MON')生成句点的另一个数据帧合并。我无法在结束时间戳上合并它,因为后者不返回周末,而是返回任何end,这可能是一周的中间。

顺便说一句,任何人都知道为什么freqpd.Grouper的{​​{1}}行为有所不同?后者返回周一至周一周,但是pd.date_range,而前者使用freq='W-MON'相同。或者我错过了什么?

0 个答案:

没有答案