我有一个Dataframe,我需要找出每个url存在多少个唯一id(这是数据帧中的另一列)。
数据框如下所示:
12333 google.com
13232 yahoo.com
12333 yahoo.com
12333 google.com
在此表中,结果将是:
google.com 1
yahoo.com 2
我在其他方面试过这个:
pdf.groupby(['url', 'id']).size().reset_index().rename(columns={0: 'count'})
给了我这个df:
google.com 12333 2
yahoo.com 13232 1
yahoo.com 13333 1
我只是不确定如何进入最后一步。