我有一个pandas DataFrame,我按几列分组,其中一些包含空值:
>>> gp = df.groupby(columns)
我希望有大约1000个不同的群组,这就是我使用len()
的原因:
>>> len(gp)
1000
但是,当我应用聚合函数时,我只能获得~50行!
>>> gp.mean().shape[0]
50
有什么想法吗?这是因为我用于聚合的列包含空值吗?有没有办法强制pandas将null值视为任何其他值,并产生使用SQL GROUP BY
和AVG?