我一直在处理Titanic数据集,并尝试使用SimpleImputer类删除NaN值。不幸的是,它似乎没有做任何事情。我发现了一个与此相关的较旧的文章,但似乎没有答案。这是我的代码:
import numpy as np
from sklearn.impute import SimpleImputer
imp = SimpleImputer( missing_values = np.nan, strategy='median')
imp.fit_transform(X_train)
imp.fit_transform(y_train)
X_train
是具有属性Sex(作为整数),Age,SibSp,Parch,Pclass和Fare的数据框。 y_train
包含生存信息。