我正在尝试实现自定义rbf内核函数。但是我收到以下错误。我不确定为什么会有一定数量的数据点? 此行代码出错:
rbf_y = rbf_kernel.predict(X_test)
代码
def myKernel(x,y):
pairwise_dists = squareform(pdist(x, 'euclidean'))
K = scip.exp(-pairwise_dists ** 2 / .08 ** 2)
return K
rbf_kernel = svm.SVC(kernel=myKernel, C=1).fit(X_train, Y_train.ravel())
rbf_y = rbf_kernel.predict(X_test)
rbf_accuracy = accuracy_score(Y_test, rbf_y)
错误:
ValueError: X.shape[1] = 15510 should be equal to 31488, the number of samples at training time
数据形态
X_train shape: (31488, 128)
X_test shape: (15510, 128)
Y_train shape: (31488, 1)
Y_test shape: (15510, 1)
从内核返回形状
myKernel(X_train, X_train).shape = (31488, 31488)
答案 0 :(得分:0)
自定义内核kernel(X, Y)
应计算矩阵X
和矩阵Y
之间的相似性度量,输出应为[X.shape[0], Y.shape[0]]
形状。你的内核函数会忽略Y
,并返回一个形状[X.shape[0], X.shape[0]]
的矩阵,这会导致你看到的错误。
要解决此问题,请实现一个计算正确形状的内核矩阵的内核函数。 Scikit-learn的custom kernels documentation有一些简单的例子说明这可能有用。
如果是您的特定内核,您可以尝试cdist(x, y)
代替squareform(pdist(x))
。