以2D特征数组作为输入的高斯过程 - scikit-learn

时间:2018-06-06 07:18:49

标签: python-3.x machine-learning scikit-learn

我需要使用scikit-learn库在Python中实现GPR(高斯过程回归)。

我的输入X有两个功能。 防爆。 X = [x1,x2]。输出是一维y = [y1]

我想使用两个内核; RBF和Matern,使得RBF使用'x1'特征,而Matern使用'x2'特征。 我尝试了以下方法:

import numpy as np
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import Matern as M, RBF as R

X = np.matrix([[1.,2], [3.,4], [5.,1], [6.,5],[4, 7.],[ 9,8.], [1.,2], [3.,4], [5.,1], [6.,5],[4, 7.],[ 9,8.],[1.,2], [3.,4], [5.,1], [6.,5],[4, 7.],[ 9,8.]]).T

y=[0.84147098,  0.42336002, -4.79462137, -1.67649299,  4.59890619,  7.91486597, 0.84147098,  0.42336002, -4.79462137, -1.67649299,  4.59890619,  7.91486597, 0.84147098,  0.42336002, -4.79462137, -1.67649299,  4.59890619,  7.91486597]

kernel = R(X[0]) * M(X[1])
gp = GaussianProcessRegressor(kernel=kernel)

gp.fit(X, y)

但这会产生错误

  

ValueError:找到样本数不一致的输入变量:[2,18]

我尝试了几种方法但找不到解决方案。真的很感激,如果有人可以提供帮助。

1 个答案:

答案 0 :(得分:2)

您的X不应该是一个矩阵,而是一个2D元素数组:

X = np.array([[1.,2], [3.,4], [5.,1], [6.,5],[4, 7.],[ 9,8.], [1.,2], [3.,4], [5.,1], [6.,5],[4, 7.],[ 9,8.],[1.,2], [3.,4], [5.,1], [6.,5],[4, 7.],[ 9,8.]])

# rest of your code as is

gp.fit(X, y)

# result:

GaussianProcessRegressor(alpha=1e-10, copy_X_train=True,
             kernel=RBF(length_scale=[1, 2]) * Matern(length_scale=[3, 4], nu=1.5),
             n_restarts_optimizer=0, normalize_y=False,
             optimizer='fmin_l_bfgs_b', random_state=None)

那就是说,你的内核定义不会做你想做的事情;最有可能你必须改为

kernel = R([1,0]) * M([0,1]) 

但我不太确定 - 请务必查看文档以获取RBFMatern内核的正确参数...