GridSearchCV和LogisticRegression引发ValueError:无法处理连续和二进制的混合

时间:2014-06-05 13:19:49

标签: python python-2.7 machine-learning scikit-learn

我正在尝试使用LogisticRegression运行gridsearch,并获取

ValueError: Can't handle mix of continuous and binary

我已将此错误追溯到metrics.accuracy_score。显然预测并不是那么好,虽然y_true是连续的(和其他数据一样),但y_pred全为零,因此被归类为二进制。

  • 有什么办法可以避免这个错误吗?
  • y_pred的性质是否意味着我根本没有使用逻辑回归的业务,或者这可能是使用参数的结果?

由于

1 个答案:

答案 0 :(得分:3)

有些令人困惑的逻辑回归实际上是一种分类算法(参见http://scikit-learn.org/stable/modules/linear_model.html#logistic-regression)。因此,您提供的目标(" y_true")应为二进制数据。如果您实际上是在尝试解决回归问题,则应选择其他算法,例如: LinearRegression,SVR,RandomForestRegressor等