在我正在进行的任务中,我训练了一个SVM 我的训练集得到了结果
accuracy: 0.983
true positive rate: 0.544
false positive rate: 0.006
true negative rate: 0.439
false negative rate: 0.012
测试验证集的结果显示我
accuracy: 0.979
true positive rate: 0.816
false positive rate: 0.003
true negative rate: 0.164
false negative rate: 0.018
两者的准确度都很高,我认为这是一件好事, 但对于真正的积极等,我应该瞄准什么样的价值观 他们究竟是什么意思?
答案 0 :(得分:0)
关于四个结果的含义:
真实位置:结果应该是positiv(= class 1),模型的预测结果是positiv(= class 1) - >高价值的这个很好!
误报:结果应该是negativ(= class 0),但模型返回了positiv结果(= class 1)。事实上,模型混淆了两个类,这是不好的。因此,数字越低越好。
真阴性:结果应为负数(= 0级),模型的答案为负数(= 0级)。这是好的,更大的数字更好。
假阴性:结果应为正(= 1级),但模型返回负值(= 0级)。这很糟糕,数字越低越好。
这四个都是百分比。它们总共应该达到1(= 100%)。真正的负面和真实的正面率总和达到了准确性。
机器学习是非常特定于数据的,所以没有人能够在没有使用多种算法和参数测试您的特定数据的情况下判断出预期的性能。如果存在这样的公式会很好,这将告诉一个使用什么算法和参数,但实际上直到今天才知道的唯一方法是针对特定问题测试不同的设置。
答案 1 :(得分:0)
虽然马库斯的回答非常清楚地解释了什么是真/假阳性/阴性。这可能有点误导,因为问题是他们各自的率,这不是一回事。
然而,这些是从真/假阳性/否定产生的,因此您应该阅读维基百科上的this文章,解释这些费率究竟是什么。
其中TP =真阳性,FN =假阴性等