在熊猫中具有非数字值的colume中填充缺失值

时间:2019-03-03 18:32:13

标签: pandas scikit-learn missing-data

我想填充缺失值,但列具有非数值,因此我无法使用均值和中位数填充

国家/地区
印度
印度
美国
NaN
印度

所以在这里我该如何用印度替换NAN,因为印度是最长时间 我尝试过Imputer类,但没有用

from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 'NaN', strategy = 'median', axis = 0)
imputer = imputer.fit(train_x[:,0])
train_x[:,0] = imputer.transform(train_x[:,0])

2 个答案:

答案 0 :(得分:1)

modefillna一起使用

df=df.fillna(df.mode().iloc[0])
df
  Country
0   India
1   India
2     USA
3   India
4   India

答案 1 :(得分:1)

尝试:

df.fillna(df['Country'].mode()[0], inplace=True)

相关问题