如何使用Confusion Matrix计算情感分析多级分类器的精度和召回?

时间:2017-07-13 18:56:50

标签: classification sentiment-analysis

我想知道如何使用Confusion Matrix使用混淆矩阵情感分析多类分类器来计算精度和召回率。我有一个5000个文本的数据集,我为100个样本做了人工标记。现在,我想基于这个数据样本计算分类器的精度和召回。我有三节课;积极,中立和消极。

那么如何为每个课程计算这些指标呢?

由于我是stackoverflow中的新手,我无法说明我的混淆矩阵,所以让我们假设我们有以下混淆矩阵:

red color   > Negative
green color > Positive
purple color> Neutral

enter image description here

2 个答案:

答案 0 :(得分:0)

您可以使用sklearn' classification report

答案 1 :(得分:0)

你可以衡量

精度 = TPos /(TPos + TNeg + TNeu),即30 /(30 + 20 + 10)= 50%,

召回 = TPos /(TPos + FNeg + FNeu),即30 /(30 + 50 + 20)= 30%,

F-measure = 2 *精度*召回/(精确+召回)= 37.5%,

准确度(全部为真)/(所有数据)= 30 + 60 + 80/300 = 56.7%。

了解更多http://blog.kaggle.com/2015/10/23/scikit-learn-video-9-better-evaluation-of-classification-models/