我有一个数据框,其中一列是时间戳。 例如:
week Energy Value
1152 2018-01-09 00:00:00 None 0.000000
1153 2018-01-09 00:10:00 None 0.000000
1154 2018-01-09 00:20:00 None 104.000000
1155 2018-01-09 00:30:00 None 104.049080
1156 2018-01-09 00:40:00 None 0.000000
1157 2018-01-09 00:50:00 None 0.000000
1158 2018-01-09 01:00:00 None 46.428571
1159 2018-01-09 01:10:00 None 0.000000
1160 2018-01-09 01:20:00 None 0.000000
1161 2018-01-09 01:30:00 None 113.846154
1162 2018-01-09 01:40:00 None 126.108374
1163 2018-01-09 01:50:00 None 0.000000
1164 2018-01-09 02:00:00 None 35.398230
1165 2018-01-09 02:10:00 None 0.000000
1166 2018-01-09 02:20:00 None 0.000000
1167 2018-01-09 02:30:00 None 71.937984
1168 2018-01-09 02:40:00 None 0.000000
1169 2018-01-09 02:50:00 None 0.000000
1170 2018-01-09 03:00:00 None 30.877193
1171 2018-01-09 03:10:00 None 0.000000
现在,我使用pd.Grouper
将其分组到该列,但它返回与分组周期的 end 对应的日期时间。这是我的查询
df = df.groupby([pd.Grouper(key=timestamp, freq='W'), 'ID'])
返回:
week Count
2018-01-07 984
2018-01-14 566
2018-01-21 725
2018-01-28 815
2018-02-04 774
2018-02-11 648
2018-02-18 807
2018-02-25 804
2018-03-04 967
2018-03-11 953
这已经非常令人困惑,因为使用freq='W'
会在星期日返回常规星期一到星期一星期,即星期结束,而不是星期开始< / em>在星期天,正如我假设的那样。当然,the documentation没有任何意义,因为所有它都表示每周频率(星期日)&#34;。
我的主要问题是,如何让时间戳列(分组后)返回与句点 start 对应的时间戳?这是必要的,因为我需要将此数据帧与使用pd.date_range(start, end, freq='W-MON')
生成句点的另一个数据帧合并。我无法在结束时间戳上合并它,因为后者不返回周末,而是返回任何end
,这可能是一周的中间。
顺便说一句,任何人都知道为什么freq
和pd.Grouper
的{{1}}行为有所不同?后者返回周一至周一周,但是pd.date_range
,而前者使用freq='W-MON'
相同。或者我错过了什么?