Question

我创建了具有基本相同信息的多个数据框，并且我需要计算一个特定列的平均值。我正在使用此代码df.loc['Total', 'Column']= df['Column'].mean()，该代码已经在我的前几个数据帧中正常工作，并且通常返回以下内容：

0        1.000000e+02
1        1.000000e+02
2        1.000000e+02
3        1.000000e+02
4        1.000000e+02
             ...     
84957    1.000000e+02
84958    1.000000e+02
84959    1.000000e+02
Total    1.002251e+02
Name: Column, Length: 84961, dtype: float64

但是，我刚遇到一个数据集，该数据集的列中至少有一个NaN值，而均值函数似乎没有起作用，并且正在返回NaN作为均值，如下所示。

1         71.111111
2               NaN
3         68.888889
4         68.181818
5         68.181818
            ...    
84957    244.444444
84958    244.444444
84959    233.333333
84960    237.500000
Total           NaN
Name: Column, Length: 84961, dtype: float64

我不知道为什么它返回NaN，我能发现的这个数据帧与另一个数据帧之间唯一的明显区别是存在一个NaN值。当我创建一个仅包含5行并具有单个NaN的简单数据框时，均值可以正确计算。对于为什么以及如何解决此问题的任何帮助，将不胜感激。

df ['Column']。mean（）返回nan

0 个答案: