有没有办法在调用groupby对象的mean()
方法时记录样本大小?
考虑以下数据框:
In [16]: df
Out[16]:
formation phi sw
0 nio 14 47
1 nio 10 16
2 nio 12 12
3 nio 19 82
4 nio 23 43
5 fthays 24 19
6 codell 23 5
7 codell 24 45
8 codell 9 11
9 graneros 26 11
10 graneros 15 45
11 graneros 12 16
12 dkot 11 79
使用groupby对象的formation
方法计算每个mean()
的平均值很容易:
In [17]: df.groupby(['formation']).mean()
Out[17]:
phi sw
formation
codell 18.666667 20.333333
dkot 11.000000 79.000000
fthays 24.000000 19.000000
graneros 17.666667 24.000000
nio 15.600000 40.000000
但我想知道是否有办法为样本量添加一列。所以我想要的输出就像是:
phi sw n
formation
codell 18.666667 20.333333 3
dkot 11.000000 79.000000 1
fthays 24.000000 19.000000 1
graneros 17.666667 24.000000 3
nio 15.600000 40.000000 5