将数据帧中的NaN转换为零

时间:2018-02-23 21:56:32

标签: python pandas dataframe replace nan

我有字典并使用创建了Pandas cars = pd.DataFrame.from_dict(cars_dict,orient =' index') 和 对索引进行排序(按字母顺序排列的列 cars = cars.sort_index(axis = 1) 排序后我注意到DataFrame有NaN,我不确定 如果真正的np.nan值? print(cars.isnull()。any()),所有列都显示为false。

我尝试了不同的方法来转换那些" NaN"值为零这是我想要做的但不是它们正在工作。 我尝试过替换和fillna方法,没有任何作用 以下是我的数据帧示例..

            speedtest          size 
toyota       65                NaN 
honda        77                800 

2 个答案:

答案 0 :(得分:7)

如果值是字符串,请使用replacenp.where

df = df.replace('NaN', 0)

或者,

df[:] = np.where(df.eq('NaN'), 0, df)

或者,如果它们实际上是NaN(似乎不太可能),那么使用fillna

df.fillna(0, inplace=True)

或者,要同时处理这两种情况,请使用apply + pd.to_numeric(稍慢但保证在任何情况下都有效):

df = df.apply(to_numeric, errors='coerce').fillna(0, downcast='infer')

感谢piRSquared这个!

答案 1 :(得分:1)

@ cs95的答案在这里无效。

必须将numpy导入为np并将replacenp.Nan和inplace = True一起使用

import numpy as np

df.replace(np.NaN, 0, inplace=True)

然后所有列的数值都变为0,而不是NaN。