在计算精度和召回率时,字义意义上的fp和tn是什么?

时间:2016-11-11 20:12:44

标签: python-3.x nlp

我想计算单词意义消歧的精确度和召回率。当然,为此,我需要计算tp,tn,fp和fn。我知道tp是测试语句的标签等于分类器标签的文件数,fn是测试句的标签不等于分类器找到的标签的文档数。但是什么是tn和fp?除了我上面描述的两种情况之外,我看不到任何其他情况。例如,我的测试句子如下所示:

第一句话:word1 word2 word3 word4 tag1 第二句:word1 word2 word3 word4 tag2

如果我的分类器找到了与句子中的标签相同的正确标签,那么除非它是fn,否则它是tp。那么tn和fp是什么?

1 个答案:

答案 0 :(得分:0)

我认为你太过积极地接受了“积极的"和"否定"。

我们认为你的句子分类是二元的:它是一个陈述或一个问题。

https://cloud.google.com/trace/docs/faq

所以,在这里,我们正在考虑Statement = positive;问题=否定:

  • True Positive =您的分类器预测了Statement并且它是一个声明。
  • 误报=您的分类器(错误地)预测声明(正面)实际上句子是一个问题。
  • False Negative =您的分类器(错误地)预测问题(否定),而实际上该句子是一个陈述。
  • True Negative =你的分类器预测句子是一个问题,这是一个问题。
  

我知道tp是测试标签的文件数量   句子等于分类器的标签

不,那是(tp + tn)。正确预测的陈述数量+正确预测的问题数量。

  

fn是测试句的标签不是的文档数   等于分类器找到的标签

那是(fp + fn)。标记为问题的语句数量+标记为语句的问题数量。

再次,"积极"和"否定"只是课程。