我有几张像这样的df: df
id created_at
0 1086341956479959040 2019-01-18 19:18:00
1 1086342030027091969 2019-01-18 19:18:17
2 1086342031067234304 2019-01-18 19:18:18
3 1086342040374439937 2019-01-18 19:18:20
4 1086342050168086531 2019-01-18 19:18:22
5 1086342075560456192 2019-01-18 19:18:28
6 1086342090320154625 2019-01-18 19:18:32
7 1086342101254721536 2019-01-18 19:18:34
要进行绘制,我进行分组:
df_all.groupby(pd.Grouper(freq ='1Min'))。count()。plot()
这给了我我想要的,随着时间的推移每分钟的id计数。
现在我有了其他df,它们的结构与上面的相同,但具有不同的id和不同的时间分布,但在相同的时间范围内。 我不知道如何在同一张图中绘制所有数据,我尝试了pd.concat,但是我有多个ID列(很好),但也有created_at列(不好)
如何以有意义的方式合并数据?
我尝试进行遮罩,选择了日期范围:
mask =(df_all ['created_at']>'2019-01-01')&(df_all ['created_at'] <='2019-01-30')
但它不会影响合并