我正在为我的问题寻找解决方案,但我找不到。所以我希望你能帮助我。
问题:
我想在一分钟内计算一下推文的数量。
数据集:
time sentiment
0 2018-05-02 14:28:59.281 0.8104
1 2018-05-02 14:29:03.540 0.6536
2 2018-05-02 14:29:09.570 0.0000
3 2018-05-02 14:29:10.445 0.0000
4 2018-05-02 14:29:22.245 0.0000
5 2018-05-02 14:29:23.349 0.4389
6 2018-05-02 14:29:28.329 0.2732
7 2018-05-02 14:29:30.410 0.2732
8 2018-05-02 14:29:46.122 0.0000
9 2018-05-02 14:29:53.194 -0.5562
我想在一分钟内计算推文的数量,然后绘制它们。但是当我使用groupby().count()
时,这会删除日,月和年。
我收到第1分钟的所有推文,但我想获得14:29 2018-05-02
的推文数量,然后是14:30 2018-05-02
的推文数量。
答案 0 :(得分:1)
使用pandas数据框,groupby
可以使用一分钟和count
。您需要确保time
是datetime
字段,例如:
df.time = pd.to_datetime(df.time)
然后简单地说:
df.groupby(df.time.dt.to_period('Min')).count()