我有一个包含多个列的数据框df。
我想使用df.groupby['A']
进行分组,并按'B'
列进行分组,以便每次select n data from 'B'
和存储均值。
我试过的是
Sample= df.groupby['A'].agg({'B':np.mean()})
,但我不知道每次如何select n data from B
然后存储它的意思。
答案 0 :(得分:0)
首先,您可以通过以下方式从B列中选择相应的子集,假设“类别”是您的选择标准:
subB = df[df['B'] == 'Category']
可以通过以下方式应用该组:
grouped_selection = subB.groupby(['A']).mean()
print(grouped_selection)
在一种情况下,它看起来像这样:
grouped_secection = df[df['B'] == 'Category'].groupby(['A']).mean()