测试集上的得分 - 文本挖掘

时间:2017-01-19 17:00:02

标签: python-3.x machine-learning text-mining logistic-regression

我尝试在得分验证后打印准确度得分。分数验证等于82%。但准确度得分等于0 ......

grid = GridSearchCV(pipe, param_grid, cv=5)
grille=grid.fit(text_train, Y_train)
y_pred = grille.predict(text_test)
from sklearn import metrics
#matrice de confusion
print("matrice confusion")
print(metrics.confusion_matrix(Y_test,y_pred))
#succès en test
print("score accuracy")
print(metrics.accuracy_score(Y_test,y_pred))

当我打印混淆矩阵时:

 [[   0    0    0    0    0    0    0    0    0    0   27    2]
 [   0    0    0    0    0    0    0    0    0    0   88   23]
 [   0    0    0    0    0    0    0    0    0    0   12    0]
 [   0    0    0    0    0    0    0    0    0    0   22    4]
 [   0    0    0    0    0    0    0    0    0    0  108   90]
 [   0    0    0    0    0    0    0    0    0    0   28   60]
 [   0    0    0    0    0    0    0    0    0    0   16   94]
 [   0    0    0    0    0    0    0    0    0    0   49  424]
 [   0    0    0    0    0    0    0    0    0    0    5   76]
 [   0    0    0    0    0    0    0    0    0    0   78 1487]
 [   0    0    0    0    0    0    0    0    0    0    0    0]
 [   0    0    0    0    0    0    0    0    0    0    0    0]]

我不明白为什么..我的矩阵的格式是什么(0 0 0 0 0 0 0 27)

1 个答案:

答案 0 :(得分:0)

以下是confusionaccuracy的文档。

很简单,混淆矩阵声称所有验证输入都在0-9类中,但错误地识别为10级或11级。

由于您未能提供规范Minimal, complete, verifiable example,因此我无法解决此问题。请使用可以重现问题的代码更新此内容。