数据帧样本熊猫的平均值

时间:2020-09-12 17:30:44

标签: python pandas dataframe pandas-groupby

我有一个包含多个列的数据框df。 我想使用df.groupby['A']进行分组,并按'B'列进行分组,以便每次select n data from 'B'和存储均值。 我试过的是 Sample= df.groupby['A'].agg({'B':np.mean()}),但我不知道每次如何select n data from B然后存储它的意思。

1 个答案:

答案 0 :(得分:0)

首先,您可以通过以下方式从B列中选择相应的子集,假设“类别”是您的选择标准:

subB = df[df['B'] == 'Category']

可以通过以下方式应用该组:

grouped_selection = subB.groupby(['A']).mean()

print(grouped_selection)

在一种情况下,它看起来像这样:

grouped_secection = df[df['B'] == 'Category'].groupby(['A']).mean()
相关问题