我有一个用例:
数据的格式为:Col1,Col2,Col3和Timestamp。
现在,我只想获得行数与时间戳分区的数量。
即。对于每半个小时的桶(即使是那些没有相应行的桶),我需要计算有多少行。
时间戳分布在一年内,所以我不能把它分成24个桶。
我必须以30分钟的间隔对它们进行分类。
答案 0 :(得分:1)
选项1
带有groupby
对象的pd.Grouper
# optionally, if needed
# df.Timestamp = pd.to_datetime(df.Timestamp, errors='coerce')
df.groupby(pd.Grouper(key='Timestamp', freq='30min')).count()
选项2
resample
df.set_index('Timestamp').resample('30min').count()