我想计算单词意义消歧的精确度和召回率。当然,为此,我需要计算tp,tn,fp和fn。我知道tp是测试语句的标签等于分类器标签的文件数,fn是测试句的标签不等于分类器找到的标签的文档数。但是什么是tn和fp?除了我上面描述的两种情况之外,我看不到任何其他情况。例如,我的测试句子如下所示:
第一句话:word1 word2 word3 word4 tag1 第二句:word1 word2 word3 word4 tag2如果我的分类器找到了与句子中的标签相同的正确标签,那么除非它是fn,否则它是tp。那么tn和fp是什么?
答案 0 :(得分:0)
我认为你太过积极地接受了“积极的"和"否定"。
我们认为你的句子分类是二元的:它是一个陈述或一个问题。
https://cloud.google.com/trace/docs/faq
所以,在这里,我们正在考虑Statement = positive;问题=否定:
我知道tp是测试标签的文件数量 句子等于分类器的标签
不,那是(tp + tn)。正确预测的陈述数量+正确预测的问题数量。
fn是测试句的标签不是的文档数 等于分类器找到的标签
那是(fp + fn)。标记为问题的语句数量+标记为语句的问题数量。
再次,"积极"和"否定"只是课程。