两列中唯一值的数据帧计数

时间:2017-06-28 16:31:26

标签: python pandas dataframe

我有一个包含两列A和B的大数据框:

%eval(%eval(&split <= 0) or %eval(&split >= 1))

我想获得一个数据框,其中B中每个唯一元素的B中唯一元素的数量和A中与b相关的唯一元素的数量:

        A              B                                         
0     US1           URL1                                                                                              
1     US2           URL1                                                                                              
2     US1           URL2
3     US3           URL3
4     US2           URL3
4     US2           URL3

1 个答案:

答案 0 :(得分:1)

您可以使用groupby.agg;使用size获取元素数量,使用nunique获取唯一元素的数量:

df.groupby('B', as_index=False).A.agg({'Imp': 'size', 'Aud': 'nunique'})

#      B    Imp   Aud
#0  URL1      2     2
#1  URL2      1     1
#2  URL3      3     2