我有一个带有时间戳和一个值的时间序列数据集(总共只有两列),并训练LSTM来预测每个小时的值。
所以我准备模型的数据集如下:
将值的最后5个先前值作为X,将小时的观测值作为y。 然后我将火车分开,对每个X和y进行测试。
因此,在使用最小-最大缩放器对其进行缩放之后,我得到了具有以下形状的火车和数据集。
print(train_X.shape,train_y.shape,test_X.shape,test_y.shape)
(16195, 5) (16195,) (8716, 5) (8716,)
然后我通过
建立模型 model = Sequential()
model.add(LSTM(5, input_shape=(n_steps,n_features),recurrent_dropout=0.2,return_sequences=True))
model.add(BatchNormalization())
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
我拟合模型并通过
进行预测history = model.fit(train_X, train_y, epochs=10, batch_size=64,validation_data=(test_X, test_y),shuffle=False)
#predict the instances
predicted = model.predict(test_X)
我现在预测的形状为(8716, 5, 1)
。
这是不正确的,我猜是因为预测应该与(8716,)
的test_y形状相同。
因此,当我调整为反比例时
predicted=yhat.reshape(predicted.shape[0], -1).reshape(-1, 1)
inverse_predictions= scaler_y.inverse_transform(predicted)
这使形状为(43580, 1)
,这是错误的,因为预测的对象的尺寸为(8716, 5, 1)
而不是(8716,)
。
我不确定是哪个部分导致了错误。任何帮助表示赞赏。
答案 0 :(得分:1)
您可以删除return_sequences=True
,这样可以解决此问题。
另外,您可以使用展平层,但我认为这不是您要在此处执行的操作。