按单个列分组并使用as_index = False时,在熊猫中会出现这种现象。但是,当我使用.agg
时,as_index
不再表现出预期的效果。简而言之,这似乎无关紧要。
# imports
import pandas as pd
import numpy as np
# set the seed
np.random.seed(834)
df = pd.DataFrame(np.random.rand(10, 1), columns=['a'])
df['letter'] = np.random.choice(['a','b'], size=10)
summary = df.groupby('letter', as_index=False).agg([np.count_nonzero, np.mean])
summary
返回:
a
count_nonzero mean
letter
a 6.0 0.539313
b 4.0 0.456702
当我期望轴为0 1且数据框中的字母为列时。
总而言之,我希望能够按一个或多个列进行分组,对具有多个聚合的单个列进行汇总,并返回一个数据框,该数据框不具有按列分组的索引,也不具有该列中的多重索引
答案 0 :(得分:0)
@Trenton的评论起到了作用。
summary = df.groupby('letter')['a'].agg([np.count_nonzero, np.mean]).reset_index()