按月份对数据框进行排序,然后按计数分组

时间:2019-11-25 13:41:28

标签: python pandas dataframe

我有一个标签数据框,其中有两列“日期”和“标签”,有多个相同的日期和多个相同的标签。我需要对表格进行排序,以使其显示一个唯一的日期以及一个唯一的标签,以及该标签在该月发生的次数。有什么想法可以做到吗?请在下面查看当前表格的屏幕截图。

Tags Table

1 个答案:

答案 0 :(得分:1)

import pandas as pd
df = pd.DataFrame({'Date': ['Nov','Nov','Dec'],
                   'Name':[1,2,1]}) # sample dataframe

如果您希望count拥有唯一的Names中的Date,则可以这样做

df.groupby('Date')['Name'].nunique()
    Date
Dec    1
Nov    2

如果您想将此信息添加为数据框中的新列,则可以这样做

df['count'] = df.groupby('Date')['Name'].transform('nunique')
      Date  Name  count
0  Nov     1      2
1  Nov     2      2
2  Dec     1      1