以假阴性成本加权机器学习预测

时间:2013-09-15 12:11:13

标签: machine-learning classification threshold

我有一个分类器,可以预测某个部件是否会坏。这些部分几乎相同,但只是略有不同。然而,每个部分的重要性都不同。对于例如一部分用于5种不同的机器,而下一部分用于制造100.第二部分明显具有与之相关的额外风险。我有一个模型可以预测一个部件是否会失效,并且阈值很合理。如何简单地加入这个错误成本。我不想重新训练模型,只有RF / SVM可用。

2 个答案:

答案 0 :(得分:3)

如果我理解正确的问题(问题不是非常严格地提出) - 你问的是如何让特定的机器学习模型更多地关注一些训练样本。至少有两种可能的方法来做这件事:

  • 许多现有的机器学习模型具有“样本权重”,这可以迫使模型“更多地关注”特定的训练样本,同时允许错误分类那些不太重要的人。特别是,SVM具有此功能,在sklearn中您只需在创建sample_weight分类器时设置SVM
  • 如果您使用某种交叉验证进行参数搜索,您可以使用加权评估函数,该函数将使用特定误报的“成本”知识,结果 - 您将选择最佳的参数这个加权措施

答案 1 :(得分:0)

如果已知故障成本,您为什么要将其纳入预测器?只需将其应用于您的输出。