scikit-learn中自定义内核SVM的交叉验证

时间:2015-07-11 00:51:52

标签: scikit-learn svm cross-validation

我想使用scikit-learn通过交叉验证对自定义内核SVM进行网格搜索。更确切地说是关注this example 我想定义像

这样的内核函数
def my_kernel(x, y):
"""
We create a custom kernel:
k(x, y) = x * M *y.T          
"""
return np.dot(np.dot(x, M), y.T)

其中M是内核的参数(就像高斯内核中的gamma一样)。

我想通过GridSearchCV提供此参数M,例如

parameters = {'kernel':('my_kernel'), 'C':[1, 10], 'M':[M1,M2]}
svr = svm.SVC()
clf = grid_search.GridSearchCV(svr, parameters)

所以我的问题是:如何定义my_kernel以便GridSearchCV给出M变量?

1 个答案:

答案 0 :(得分:0)

您可能必须创建一个包装类。类似的东西:

class MySVC(BaseEstimator,ClassifierMixin):
    def __init__( self, 
              # all the SVC attributes
              M ):
         self.M = M
         # etc...

    def fit( self, X, y ):
         kernel = lambda x,y : np.dot(np.dot(x,M),y.T)
         self.svc_ = SVC( kernel=kernel, # the other parameters )
         return self.svc_.fit( X, y )
    def predict( self, X ):
         return self.svc_.predict( X )
    # et cetera