我想填充缺失值,但列具有非数值,因此我无法使用均值和中位数填充
国家/地区
印度
印度
美国
NaN
印度
所以在这里我该如何用印度替换NAN,因为印度是最长时间 我尝试过Imputer类,但没有用
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 'NaN', strategy = 'median', axis = 0)
imputer = imputer.fit(train_x[:,0])
train_x[:,0] = imputer.transform(train_x[:,0])
答案 0 :(得分:1)
将mode
与fillna
一起使用
df=df.fillna(df.mode().iloc[0])
df
Country
0 India
1 India
2 USA
3 India
4 India
答案 1 :(得分:1)
尝试:
df.fillna(df['Country'].mode()[0], inplace=True)