在Pandas中应用groupyby时如何省略NaN值

时间:2017-04-04 23:54:19

标签: python pandas

我有一个由多列组成的数据集,我想通过Python中的groupby函数来计算平均值。但是,由于某些值为NAN,因此当存在NAN值时,我会得到该特定组的平均值为NAN。我想省略这个值,不要将它设置为零或用任何统计变量填充它,只是省略。

知道如何实现这个目标吗?

提前致谢!

2 个答案:

答案 0 :(得分:1)

mean方法忽略了NaN:

import pandas as pd
import numpy as np

df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [3., 4., np.nan, 5.]}) 
#    a   b
# 0  1   3
# 1  1   4
# 2  2 NaN
# 3  2   5

df.groupby('a').mean()
#      b
# a     
# 1  3.5
# 2  5.0

答案 1 :(得分:0)

  

当得到NAN值时,我得到该特定组的平均值为NAN   在场

FALSE! :)

均值只会考虑非空值。你是我的男人。