我有一个带有10000个剩余数据点的降采样数据集,每个数据点都有800个特征。尽管如此,无论我使用什么C,模型都可以预测相同的数据。我使用代码:
from sklearn.linear_model import LogisticRegression
for C in [1, 40, 1000, 1]:
logreg = LogisticRegression(C = C, solver='saga').fit(X_train_ds, Y_train_ds)
Y_pred = logreg.predict(X_test)
我尝试同时使用'saga'
和'liblinear'
求解器,但是模型仍预测相同的值。我还尝试将C值设置为可笑的高和低值,例如10000000和0.00000001,但仍然没有任何变化。
有人知道我哪里出错了吗?