假设我正在使用两种方法'A'和'B'评估一些文本分类研究项目。当使用方法'A'时,我得到的精度提高了x%,而'B'则提高了x%的召回率。我怎么能说A或B方法更好?
答案 0 :(得分:4)
这取决于你的目标。如果你需要前几个返回的类是正确的那么你应该去精确,如果你想专注于返回所有相关的类,然后尝试增加召回。
如果精确度和召回对您来说都很重要,那么常用的衡量标准是F1 score,它将精确度和召回率结合到一个度量中。
答案 1 :(得分:1)
我完全赞同@Sicco所写的内容。
另外,我建议观看this video,它来自Coursera的机器学习课程。从视频中:在某些情况下,您可以通过更改阈值来操纵精度和召回。如果你不确定对你来说什么更重要,那就坚持F1。