python-3.x - 如何在F-beta分数中选择beta

如何在F-beta分数中选择beta

时间：2018-10-22 17:39:37

标签： python-3.x machine-learning scikit-learn random-forest grid-search

我正在使用网格搜索来优化随机森林在平衡数据集上的超参数拟合，并且正在努力选择哪种模型评估指标。考虑到此问题的实际情况，假阴性比假阳性的代价更高。我最初尝试优化召回率，但最终却出现了大量的误报。我的解决方案是使用beta> 1来优化f-beta得分。我的问题是，如何最好地选择beta？如果我可以计算出假阴性和假阳性的成本，我可以设置beta =假阴性成本/假阳性成本吗？这种方法有意义吗？

1 个答案:

答案 0 :(得分：0)

要赋予Precision更大的权重，我们在间隔0
要赋予召回更多的权重，我们在间隔1 中选择一个Beta值。

当您设置 beta =假阴性的费用/假阳性的费用时，如果假阴性的费用高于假阳性的费用，则您将赋予更多的权重，这样就可以了，但这并不意味着这是解决您问题的最佳解决方案。

优化Beta与数据的形状有关，因此最好在数据上尝试不同的Beta值，直到获得最佳价值为止。