测试数据的模型精度与混淆矩阵精度之间的差异

时间:2020-06-14 06:34:09

标签: nlp

  • 我正在为NLP项目工作,我想进行文本分类 使用神经n / w
  • 测试集的准确度达到了98%。
  • 但是,当我尝试检查混淆矩阵的准确性(使用混淆矩阵的准确性得分)时,仅为52%。
  • 怎么可能?我在这里想念什么?

问题

这两个精度之间的区别是哪一个应被视为实际精度?为什么?

测试集上的代码

loss, acc = model.evaluate(Xtest, y_test_array)

1 个答案:

答案 0 :(得分:0)

您的数据集似乎存在类不平衡,并且根据混淆矩阵计算出的指标(不是准确性-可能像F1分数一样)很低,因为少数类的识别度很差。同时,由于大多数人都被公认,因此准确性很高。