如果我有一个熊猫数据框df,则以下三种计算列平均值的方法将得出相同的结果:
import numpy as np
df.mean(axis = 0)
df.apply(np.mean)
df.aggregate(np.mean)
但是如果我创建一些组并以类似方式使用这些方法呢?
groups = df.groupby(by = 'A')
groups.mean()
groups.apply(np.mean)
groups.aggregate(np.mean)
...在此示例中,.mean和.aggregate给出相同的结果,但.apply不给出相同的结果。使用.apply,分组的列“ A”将作为索引和列返回(当我遇到此问题时,这不是我期望或想要的)
这种行为对我来说似乎是不一致的,还是我错过了这三种方法之间的根本区别?