在Python中执行LogisticRegression时,我在混淆矩阵中得到了不同的结果。
# steps
# ------
from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression(random_state=0)
logreg.fit(train_x, train_y)
# prediction
# ------------
pred_y = logreg.predict(test_x)
# confusion matrix
# ------------------
confusion_matrix(pred_y,test_y)
在此CM中,显示的数字是正确的数字:
[[10683 813]
[ 280 581]]
当我使用Pandas混淆矩阵(带有标题打印)时,会得到一组不同的数字。
from pandas_ml import ConfusionMatrix
ConfusionMatrix(pred_y,test_y)
我得到了这个结果:
Predicted False True __all__
Actual
False 3312 127 3439
True 246 10 256
__all__ 3558 137 3695
即使我使用相同的实际(test_y
)和预测(pred_y
)值,数字也不匹配
如果您能指导我哪里出问题了,我将不胜感激。