这是我的新日常事务,其中我处理带有{strong>许多列的df
列,其中包括以下两列:user
和{{1 }}。我为每个event
计算event
的数量,并在原始user
上添加新列count
。然后,我只保留df
和user
,那里有多个相同的行,然后执行count
删除重复项,从而为每个drop_duplicates()
获得事件count
。我确定我正在做一些多余的工作。
执行此类任务的一种好方法。
user
答案 0 :(得分:0)
将GroupBy.count
用于Series
,然后呼叫Series.plot.bar
:
df.groupby('user')['event'].count().plot.bar()