熊猫groupby返回具有两个以上聚合的multiindex

时间:2020-10-11 16:10:28

标签: pandas group-by

按单个列分组并使用as_index = False时,在熊猫中会出现这种现象。但是,当我使用.agg时,as_index不再表现出预期的效果。简而言之,这似乎无关紧要。

# imports
import pandas as pd
import numpy as np

# set the seed
np.random.seed(834)

df = pd.DataFrame(np.random.rand(10, 1), columns=['a'])

df['letter'] = np.random.choice(['a','b'], size=10)

summary = df.groupby('letter', as_index=False).agg([np.count_nonzero, np.mean])
summary

返回:

    a
count_nonzero   mean
letter      
a   6.0 0.539313
b   4.0 0.456702

当我期望轴为0 1且数据框中的字母为列时。

总而言之,我希望能够按一个或多个列进行分组,对具有多个聚合的单个列进行汇总,并返回一个数据框,该数据框不具有按列分组的索引,也不具有该列中的多重索引

1 个答案:

答案 0 :(得分:0)

@Trenton的评论起到了作用。

summary = df.groupby('letter')['a'].agg([np.count_nonzero, np.mean]).reset_index()