如何在Pandas中更好地做到这一点:计数,删除列,删除重复项

时间:2018-12-07 09:39:18

标签: python pandas dataframe duplicates

这是我的日常事务,其中我处理带有{strong>许多列的df列,其中包括以下两列:user和{{1 }}。我为每个event计算event的数量,并在原始user上添加新列count。然后,我只保留dfuser,那里有多个相同的行,然后执行count删除重复项,从而为每个drop_duplicates()获得事件count。我确定我正在做一些多余的工作。

执行此类任务的一种好方法。

user

1 个答案:

答案 0 :(得分:0)

GroupBy.count用于Series,然后呼叫Series.plot.bar

df.groupby('user')['event'].count().plot.bar()