我创建了具有基本相同信息的多个数据框,并且我需要计算一个特定列的平均值。我正在使用此代码df.loc['Total', 'Column']= df['Column'].mean()
,该代码已经在我的前几个数据帧中正常工作,并且通常返回以下内容:
0 1.000000e+02
1 1.000000e+02
2 1.000000e+02
3 1.000000e+02
4 1.000000e+02
...
84957 1.000000e+02
84958 1.000000e+02
84959 1.000000e+02
Total 1.002251e+02
Name: Column, Length: 84961, dtype: float64
但是,我刚遇到一个数据集,该数据集的列中至少有一个NaN
值,而均值函数似乎没有起作用,并且正在返回NaN
作为均值,如下所示。
1 71.111111
2 NaN
3 68.888889
4 68.181818
5 68.181818
...
84957 244.444444
84958 244.444444
84959 233.333333
84960 237.500000
Total NaN
Name: Column, Length: 84961, dtype: float64
我不知道为什么它返回NaN
,我能发现的这个数据帧与另一个数据帧之间唯一的明显区别是存在一个NaN
值。当我创建一个仅包含5行并具有单个NaN
的简单数据框时,均值可以正确计算。对于为什么以及如何解决此问题的任何帮助,将不胜感激。