测试数据的模型精度与混淆矩阵精度之间的差异

时间：2020-06-14 06:34:09

标签： nlp

我正在为NLP项目工作，我想进行文本分类使用神经n / w
测试集的准确度达到了98％。
但是，当我尝试检查混淆矩阵的准确性（使用混淆矩阵的准确性得分）时，仅为52％。
怎么可能？我在这里想念什么？

问题

这两个精度之间的区别是哪一个应被视为实际精度？为什么？

测试集上的代码

loss, acc = model.evaluate(Xtest, y_test_array)

1 个答案:

答案 0 :(得分：0)

您的数据集似乎存在类不平衡，并且根据混淆矩阵计算出的指标（不是准确性-可能像F1分数一样）很低，因为少数类的识别度很差。同时，由于大多数人都被公认，因此准确性很高。