我有一个db表,其中包含一个日期时间列,其值超过24小时。如果我使用pandas dataframe groupby函数来进行分钟聚合,那么无论它们在哪个小时,都会将所有内容丢入0-59个桶中。
如何在表格的时间范围内分享分钟聚合,在这种情况下是24小时?此外,对于表中没有值的那些分钟,如何将该分钟的零计数插入数据帧?
答案 0 :(得分:0)
尝试使用pd.TimeGroupper
import pandas as pd
df = pd.DataFrame(index=pd.date_range("11:00", "21:30", freq="100ms"))
df['x'] = 1
g = df.groupby(pd.TimeGrouper('S')).sum()