Question

假设我在sci-kit学习中使用了以下自定义损失函数。在这种情况下，我仅对模型得分高于0.8的观察结果评分。

def customLoss(y_true, y_pred):
    a = pd.DataFrame({'Actuals':y_true, 'Preds': y_pred})
    a = a.query('Preds > 0.8')
    return(precision_score(a['Actuals'], a['Preds']))

param_grid = {'C': [0.001, 0.01, 0.1, 1, 10]}
scorer = make_scorer(mf.customLoss ,greater_is_better = True)
grid = GridSearchCV(LogisticRegression(class_weight = 'balanced'), param_grid = param_grid, scoring = scorer, cv = 5)

但是，假设我要使阈值（0.8）可配置。显然，我需要向我的损失函数添加第三个参数，如下所示：

def customLoss(y_true, y_pred, threshold):
        a = pd.DataFrame({'Actuals':y_true, 'Preds': y_pred})
        a = a.query('Preds > @threshold')
        return(precision_score(a['Actuals'], a['Preds']))

但是，我对将第三个参数放在make_scorer函数中的哪个位置有些困惑？

Answer 1

根据docs make_scorer接受一个**kwargs参数，该参数将传递给计分函数，以便您可以在调用函数时按名称添加任何其他参数。请参阅。这是您的代码，其中包含对得分手的更新调用

# New function with the `threshold` parameter
def customLoss(y_true, y_pred, threshold):
        a = pd.DataFrame({'Actuals':y_true, 'Preds': y_pred})
        a = a.query('Preds > @threshold')
        return(precision_score(a['Actuals'], a['Preds']))

...

 scorer = make_scorer(mf.customLoss ,greater_is_better = True, threshold = 0.8)

在sklearn

1 个答案: