如何解决错误:输入包含NaN,无穷大或dtype('float64')太大的值?

时间:2019-07-18 08:01:27

标签: python pandas machine-learning scikit-learn

我正在处理Titanic数据集。我已经在分类列中填写了缺失的值。类别列从索引0到索引3开始。 我已经将LabelEncoder用于分类列。

使用onehotencoder时,发生错误: 输入包含NaN,无穷大或dtype('float64')太大的值。

没有NaN值。我无法纠正此错误

我在使用OneHotEncoder之前尝试过缩放,但是仍然出现错误。

y_train = train.iloc[:,-1].values
x_train = train.iloc[:,:-1].values
test = test.iloc[:,:].values

from sklearn.preprocessing import 
LabelEncoder,OneHotEncoder,StandardScaler
for i in range(4):
    le = LabelEncoder()
    x_train[:,i]=le.fit_transform(x_train[:,i])
    test[:,i]=le.transform(test[:,i])

#sc = StandardScaler()
#x_train = sc.fit_transform(x_train)
#test = sc.transform(test)

ohe = OneHotEncoder(categorical_features=[range(4)])
x_train = ohe.fit_transform(x_train).toarray()
test = ohe.transform(test).toarray()

如何解决此错误?

0 个答案:

没有答案