Question

我有一个包含多个列的数据框df。我想使用df.groupby['A']进行分组，并按'B'列进行分组，以便每次select n data from 'B'和存储均值。我试过的是 Sample= df.groupby['A'].agg({'B':np.mean()})，但我不知道每次如何select n data from B然后存储它的意思。

Answer 1

首先，您可以通过以下方式从B列中选择相应的子集，假设“类别”是您的选择标准：

subB = df[df['B'] == 'Category']

可以通过以下方式应用该组：

grouped_selection = subB.groupby(['A']).mean()

print(grouped_selection)

在一种情况下，它看起来像这样：

grouped_secection = df[df['B'] == 'Category'].groupby(['A']).mean()

数据帧样本熊猫的平均值

1 个答案: