我正在使用 doc2vec氨基酸序列嵌入来尝试预测动力学速率。
我已经尝试对输入向量(X)进行标准化和不标准化,但是除非我对输出变量(运动速率)进行标准化,否则我的GP模型会为所有测试输入预测非常相似的数字(介于4.87和4.9之间) )?
您是应该标准化输出值还是我的模型有问题?
我正在Python中使用 GPy 软件包。
这是我的代码:
#GP Regression for word vectors
def Gp_regression(Xtrain, Ytrain, Xtest, Ytest):
kernel = GPy.kern.RBF(input_dim = 64, variance = 1, lengthscale = 1)
m = GPy.models.GPRegression(Xtrain, Ytrain, kernel=kernel, noise_var=1e-10)
m.optimize_restarts(num_restarts = 10)
Xtest = np.ndarray(shape=(1,64))
mean = m.predict(Xtest)
return mean