分组依据和values_counts

时间:2019-08-11 07:59:52

标签: python-3.x pandas pandas-groupby

我的df看起来像这样

session_id page_type
10001_0    a
10001_0    b
10001_0    b
10001_0    b
10001_0    c
10001_0    c
10002_0    a
10002_0    a
10002_0    b
10002_0    b
10002_0    c
10002_0    c

我想按“ session_id”分组并计算值(“ a”,“ b”,“ c”) 为:

session_id count_page_type
10001_0 {a:1,b:3,c:2}
10002_0 {a:2,b:2,c:2}

我不在乎“ count_page_type”列中的类型 它也可以列出。 聚合在多个列上

agg_dict = ({'uid':'first',
             'request_id':'unique',
             'sso_id':'first',
             'article_id' :['first','last','nunique'],
             'event_time':['min','max'],
             'session_duration':'sum',
             'anonymous_id':['first','nunique'],
             'platform':['first','nunique'],
             'brand':['first','last','nunique'],
             'user_type':['first','last'],
             'page_type':'value_counts'})
df.groupby('session_id').agg(agg_dict)

现在我出错了

ValueError: cannot insert page_type, already exists

有什么建议吗? 谢谢

1 个答案:

答案 0 :(得分:3)

value_counts返回的是pd.Series而不是一行,请尝试执行以下操作:

df.groupby('session_id').agg({'page_type': lambda x : x.value_counts().to_dict()})