我正在处理Titanic数据集。我已经在分类列中填写了缺失的值。类别列从索引0到索引3开始。 我已经将LabelEncoder用于分类列。
使用onehotencoder时,发生错误: 输入包含NaN,无穷大或dtype('float64')太大的值。
没有NaN值。我无法纠正此错误
我在使用OneHotEncoder之前尝试过缩放,但是仍然出现错误。
y_train = train.iloc[:,-1].values
x_train = train.iloc[:,:-1].values
test = test.iloc[:,:].values
from sklearn.preprocessing import
LabelEncoder,OneHotEncoder,StandardScaler
for i in range(4):
le = LabelEncoder()
x_train[:,i]=le.fit_transform(x_train[:,i])
test[:,i]=le.transform(test[:,i])
#sc = StandardScaler()
#x_train = sc.fit_transform(x_train)
#test = sc.transform(test)
ohe = OneHotEncoder(categorical_features=[range(4)])
x_train = ohe.fit_transform(x_train).toarray()
test = ohe.transform(test).toarray()
如何解决此错误?