我有一个pandas数据帧,缺失值表示为-999。
In [58]: df.head()
Out[58]:
EventId A B C
100000 0.91 124.711 2.666000
100001 -999.00 -999.000 -0.202838
100002 -999.00 -999.000 -0.202838
100003 -999.00 -999.000 -0.202838
我想将缺失值(由-999表示)替换为取消非缺失值的列的平均值。 这是最好的方法吗?是否有任何熊猫功能可用于轻松实现这一目标?
答案 0 :(得分:4)
df2.replace(-999, np.nan, inplace=True)
df2.fillna(df2.mean())
EventId A B C
0 100000 0.91 124.711 2.666000
1 100001 0.91 124.711 -0.202838
2 100002 0.91 124.711 -0.202838
3 100003 0.91 124.711 -0.202838