machine-learning - 以假阴性成本加权机器学习预测

以假阴性成本加权机器学习预测

时间：2013-09-15 12:11:13

标签： machine-learning classification threshold

我有一个分类器，可以预测某个部件是否会坏。这些部分几乎相同，但只是略有不同。然而，每个部分的重要性都不同。对于例如一部分用于5种不同的机器，而下一部分用于制造100.第二部分明显具有与之相关的额外风险。我有一个模型可以预测一个部件是否会失效，并且阈值很合理。如何简单地加入这个错误成本。我不想重新训练模型，只有RF / SVM可用。

2 个答案:

答案 0 :(得分：3)

如果我理解正确的问题（问题不是非常严格地提出） - 你问的是如何让特定的机器学习模型更多地关注一些训练样本。至少有两种可能的方法来做这件事：

许多现有的机器学习模型具有“样本权重”，这可以迫使模型“更多地关注”特定的训练样本，同时允许错误分类那些不太重要的人。特别是，SVM具有此功能，在sklearn中您只需在创建sample_weight分类器时设置SVM
如果您使用某种交叉验证进行参数搜索，您可以使用加权评估函数，该函数将使用特定误报的“成本”知识，结果 - 您将选择最佳的参数这个加权措施

答案 1 :(得分：0)

如果已知故障成本，您为什么要将其纳入预测器？只需将其应用于您的输出。