我想知道如何使用Confusion Matrix使用混淆矩阵情感分析多类分类器来计算精度和召回率。我有一个5000个文本的数据集,我为100个样本做了人工标记。现在,我想基于这个数据样本计算分类器的精度和召回。我有三节课;积极,中立和消极。
那么如何为每个课程计算这些指标呢?
由于我是stackoverflow中的新手,我无法说明我的混淆矩阵,所以让我们假设我们有以下混淆矩阵:
red color > Negative
green color > Positive
purple color> Neutral
答案 0 :(得分:0)
您可以使用sklearn' classification report。
答案 1 :(得分:0)
你可以衡量
精度 = TPos /(TPos + TNeg + TNeu),即30 /(30 + 20 + 10)= 50%,
召回 = TPos /(TPos + FNeg + FNeu),即30 /(30 + 50 + 20)= 30%,
F-measure = 2 *精度*召回/(精确+召回)= 37.5%,
准确度(全部为真)/(所有数据)= 30 + 60 + 80/300 = 56.7%。
了解更多http://blog.kaggle.com/2015/10/23/scikit-learn-video-9-better-evaluation-of-classification-models/