我正在使用以下article的 3.1 部分中解释的 McNemar 测试,以评估2种算法alg1和algo2的性能。我的问题涉及2x2表中元素的含义。
算法应用于由9000个查询组成的相同数据集。我想对查询进行分类。作为评估标准,我们使用准确度。如果定义如下:
If
查询已正确分类。然后将精度提高1 Else
什么都不做
准确度=(正确分类的查询数)/(查询总数)
我将在该部分中发布文章中提供的定义。我提供了自己的介绍。我的问题在于定义2.请告诉我它是否正确:
alg2而不是algo1 (n10)错误分类的查询数:仅 alg2
中错误分类的查询数| n00 | N01 |
| n10 | N11 |
答案 0 :(得分:2)
Number of missclassified examples by neither
表示两种算法都正确地对查询进行分类的查询。
二元分类的例子
SAMPLE ID | EXPECTED CLASSIFICATION | ALGO1 CLASS | ALGO2 CLASS
1 GROUP A GROUP A GROUP B
2 GROUP A GROUP A GROUP A
3 GROUP B GROUP A GROUP A
4 GROUP B GROUP A GROUP B