我一直在研究机器学习概念,但我仍然无法正确掌握哪些属性可以用来确定什么可以告诉我系统的真实准确性(如果它是TPR或正确分类的实例)
我也在寻找对ROC和Kappa Statistic的一个很好的解释。据我所知,ROC测量系统学习的程度,Kappa测量系统猜测的程度。然而,这些是我们教授多年经验的解释。看看其他技术文档,我们无法弄清楚这些术语的含义。
所以,我只需要知道什么可以告诉我的算法的准确性,以及如果算法是好的,例如ROC和Kappa Statistic,需要支持哪些属性。
请帮忙!非常感谢你!
答案 0 :(得分:1)
关于机器学习性能的两个基本标准是假阳性(错误警报)比率和假阴性(错过目标)比率。可以说,您正在寻找特定的对象类型,如果您在100个对象中检测到10个错误对象作为目标,则误报率为10%。
如果您将10个真实对象标记为100个目标对象中的out-class,则假负raio为10%。
通常在这两个比率之间存在权衡,ROC曲线区域是性能的良好指标