LogisticRegression期间的ValueError

时间:2019-11-20 08:04:13

标签: python regression

当我编写如下代码时,在逻辑回归期间出错:

logistic_regression= LogisticRegression()
logistic_regression.fit(X_train,y_train)
y_pred=logistic_regression.predict(X_test) 

我有一个错误: ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). 我该怎么办 ?

2 个答案:

答案 0 :(得分:0)

这是您必须根据数据和NaN功能决定的决定。直接使用0插值会影响您的结果。

您可以从以下几件事开始。

  1. 删除这些行,进行培训
  2. 如果是分类的:替换为mode 如果连续:用均值替换
  3. 如果是连续的(如时间序列),请尝试将其替换为上下一行的平均值。
  4. 如果连续丢失,请尝试进行插值。

等等...请解释更多有关数据的信息。

答案 1 :(得分:0)

它表示您的数据包含非数字数据,例如“ NaN”,“ Null”或“ N / A”。 您可以使用以下pandas命令处理此类数据:  1. Fillna(0)  2. Dropna()