我有一个由多列组成的数据集,我想通过Python中的groupby
函数来计算平均值。但是,由于某些值为NAN
,因此当存在NAN
值时,我会得到该特定组的平均值为NAN
。我想省略这个值,不要将它设置为零或用任何统计变量填充它,只是省略。
知道如何实现这个目标吗?
提前致谢!
答案 0 :(得分:1)
mean
方法忽略了NaN:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [3., 4., np.nan, 5.]})
# a b
# 0 1 3
# 1 1 4
# 2 2 NaN
# 3 2 5
df.groupby('a').mean()
# b
# a
# 1 3.5
# 2 5.0
答案 1 :(得分:0)
当得到NAN值时,我得到该特定组的平均值为NAN 在场
FALSE! :)
均值只会考虑非空值。你是我的男人。