我有两个数组:X(382个样本x 37个特征)和Y个(382个样本x 8个值)。我对它进行了sklearn
高斯过程。
from sklearn import gaussian_process
gp = gaussian_process.GaussianProcess()
gp.fit(X_part1, Y_part1)
第二次,我想预测与其他X值相关的Y值。我特别感兴趣的是95%置信区间,以便得到像in this example这样的情节。
y_pred, sigma2_pred = gp.predict(X_part2, eval_MSE=True)
sigma = np.sqrt(sigma2_pred)
print X_part2.shape
print y_pred.shape
print sigma.shape
(382,37) (382,8) (382)
但事实是,MSE(以及sigma)是一维阵列,我不明白为什么。一旦我的Y是一个二维数组,我认为MSE将是相同的,如文档中所述:
与y一样具有形状(n_eval,)或(n_eval,n_targets)的数组,x处的均值平方误差。
结果,我不知道如何处理这个MSE以获得95%的可信区间......