我有一个标签数据框,其中有两列“日期”和“标签”,有多个相同的日期和多个相同的标签。我需要对表格进行排序,以使其显示一个唯一的日期以及一个唯一的标签,以及该标签在该月发生的次数。有什么想法可以做到吗?请在下面查看当前表格的屏幕截图。
答案 0 :(得分:1)
import pandas as pd
df = pd.DataFrame({'Date': ['Nov','Nov','Dec'],
'Name':[1,2,1]}) # sample dataframe
如果您希望count
拥有唯一的Names
中的Date
,则可以这样做
df.groupby('Date')['Name'].nunique()
Date
Dec 1
Nov 2
如果您想将此信息添加为数据框中的新列,则可以这样做
df['count'] = df.groupby('Date')['Name'].transform('nunique')
Date Name count
0 Nov 1 2
1 Nov 2 2
2 Dec 1 1