Pandas DataFrame Bin by Timestamp

时间:2018-03-26 04:31:38

标签: python pandas time-series data-analysis

我有一个用例:

数据的格式为:Col1,Col2,Col3和Timestamp。

现在,我只想获得行数与时间戳分区的数量。

即。对于每半个小时的桶(即使是那些没有相应行的桶),我需要计算有多少行。

时间戳分布在一年内,所以我不能把它分成24个桶。

我必须以30分钟的间隔对它们进行分类。

1 个答案:

答案 0 :(得分:1)

选项1
带有groupby对象的pd.Grouper

# optionally, if needed
# df.Timestamp = pd.to_datetime(df.Timestamp, errors='coerce')  
df.groupby(pd.Grouper(key='Timestamp', freq='30min')).count()

选项2
resample

df.set_index('Timestamp').resample('30min').count()