大熊猫时间序列数据预处理

时间:2016-08-02 11:08:34

标签: python pandas dataframe time-series visualization

我的数据框看起来像这样:

> dt
    text    timestamp
0   a   2016-06-13 18:00
1   b   2016-06-20 14:08
2   c   2016-07-01 07:41
3   d   2016-07-11 19:07
4   e   2016-08-01 16:00

我想总结一下每个月的数据:

> dt_month
count   timestamp
0   2   2016-06
1   2   2016-07
2   1   2016-08

原始数据集(dt)可以通过以下方式生成:

import pandas as pd
data = {'text': ['a', 'b', 'c', 'd', 'e'],
    'timestamp': ['2016-06-13 18:00', '2016-06-20 14:08', '2016-07-01 07:41', '2016-07-11 19:07', '2016-08-01 16:00']}
dt = pd.DataFrame(data)

有没有办法可以按dt_month绘制时频图?

1 个答案:

答案 0 :(得分:1)

您可以按timestamp列转换to_period并汇总size进行分组:

print (df.text.groupby(df.timestamp.dt.to_period('m'))
              .size()
              .rename('count')
              .reset_index())

  timestamp  count
0   2016-06      2
1   2016-07      2
2   2016-08      1