Question

有没有办法在调用groupby对象的mean()方法时记录样本大小？

考虑以下数据框：

In [16]: df
Out[16]:
   formation  phi  sw
0        nio   14  47
1        nio   10  16
2        nio   12  12
3        nio   19  82
4        nio   23  43
5     fthays   24  19
6     codell   23   5
7     codell   24  45
8     codell    9  11
9   graneros   26  11
10  graneros   15  45
11  graneros   12  16
12      dkot   11  79

使用groupby对象的formation方法计算每个mean()的平均值很容易：

In [17]: df.groupby(['formation']).mean()
Out[17]:
                 phi         sw
formation
codell     18.666667  20.333333
dkot       11.000000  79.000000
fthays     24.000000  19.000000
graneros   17.666667  24.000000
nio        15.600000  40.000000

但我想知道是否有办法为样本量添加一列。所以我想要的输出就像是：

                 phi         sw   n
formation
codell     18.666667  20.333333   3 
dkot       11.000000  79.000000   1
fthays     24.000000  19.000000   1
graneros   17.666667  24.000000   3
nio        15.600000  40.000000   5

来自groupby对象的mean（）的样本大小

0 个答案: