精度与召回有关多类分类问题

时间:2019-07-18 18:09:23

标签: machine-learning metrics

比方说,我有三个类代表需要通过我的模型分类的子宫颈类型。总体目标是预测正确的子宫颈类别,以便医疗服务提供者可以为患者提供最适合其子宫颈癌的治疗方法。子宫颈类型分类错误会给医疗服务提供者增加诊断时间,并给患者带来治疗费用。在这种情况下,精度比召回更重要吗?

1 个答案:

答案 0 :(得分:0)

只需记住:

  • 回忆: 这是真阳性与假阴性之间的比率。因此,它衡量了预测良好的类与该类所有样本之间的比率。当您的目标是识别一类的所有样本(例如,预测所有罹患癌症的人)时,这会很好。

  • 精度: 这是真阳性和假阳性之间的比率。因此,它衡量了预测良好的类别与被预测为该类别的所有样本之间的比率。当您的目标是避免出现假阳性(例如,避免预测一个女人实际上没有怀孕)时,这会很好。

在这种情况下,我认为重要的是要更多地了解错误的后果。如果一个人是A型但被预测为B型,会有生命危险吗?有没有最安全的类型(即使一个人被错误分类,也没有生命危险)?最危险的(有生命危险)?

根据答案,您将能够选择最佳指标。

假设存在最安全和最危险的类型,则召回危险类型将更相关,因为您必须识别所有类型(最大数量)。