如何在sklearn SelectKBest()中设置参数来评分函数

时间:2017-06-03 19:13:39

标签: python class machine-learning syntax scikit-learn

我在sklearn中使用SelectKBest()类进行功能选择。 SelectKBest()可以将可调用分数函数作为输入。在这种情况下,我想使用mutual_info_regression作为分数函数。 mutual_info_regression可以采取一些我想自己设定的参数。例如,我想设置random_state = 0。问题是我不确定如何将参数传递到得分函数,因为得分函数本身就是SelectKBest()中的参数。显然像SelectKBest(score_func = mutual_info_classif(random_state=0))这样的东西不起作用,因为mutal_info_classif函数会被直接调用。我觉得这可能是关于python类的一个非常基本的问题,但我似乎找不到任何解决我正在寻找的东西的问题。在此先感谢您的时间!

1 个答案:

答案 0 :(得分:3)

您可以创建另一个调用mutual_info_regression并传递它的函数:

def my_score(X, y):
    return mutual_info_regression(X, y, random_state=0)

SelectKBest(score_func=my_score)

Python标准库为创建此类函数提供了有用的帮助 - 它被称为functools.partial。它允许创建预先设置了一些参数的函数;而不是“手动”my_score定义,你可以写

from functools import partial
my_score = partial(mutual_info_regression, random_state=0)
SelectKBest(score_func=my_score)

当然,您也可以直接传递partial,这会让您非常接近您的示例:

from functools import partial
SelectKBest(score_func=partial(mutual_info_classif, random_state=0))