Question

我有一个带有时间戳和一个值的时间序列数据集（总共只有两列），并训练LSTM来预测每个小时的值。

所以我准备模型的数据集如下：

将值的最后5个先前值作为X，将小时的观测值作为y。然后我将火车分开，对每个X和y进行测试。

因此，在使用最小-最大缩放器对其进行缩放之后，我得到了具有以下形状的火车和数据集。

print(train_X.shape,train_y.shape,test_X.shape,test_y.shape)
(16195, 5) (16195,) (8716, 5) (8716,)

然后我通过

建立模型

    model = Sequential()
    model.add(LSTM(5, input_shape=(n_steps,n_features),recurrent_dropout=0.2,return_sequences=True))
    model.add(BatchNormalization())
    model.add(Dense(1))    
    model.compile(loss='mean_squared_error', optimizer='adam')

我拟合模型并通过

进行预测

history = model.fit(train_X, train_y, epochs=10, batch_size=64,validation_data=(test_X, test_y),shuffle=False)


#predict the instances
predicted = model.predict(test_X)

我现在预测的形状为(8716, 5, 1)。

这是不正确的，我猜是因为预测应该与(8716,)的test_y形状相同。因此，当我调整为反比例时

predicted=yhat.reshape(predicted.shape[0], -1).reshape(-1, 1)
inverse_predictions= scaler_y.inverse_transform(predicted)

这使形状为(43580, 1)，这是错误的，因为预测的对象的尺寸为(8716, 5, 1)而不是(8716,)。

我不确定是哪个部分导致了错误。任何帮助表示赞赏。

Answer 1

您可以删除return_sequences=True，这样可以解决此问题。另外，您可以使用展平层，但我认为这不是您要在此处执行的操作。

为什么LSTM预测形状不符合预期？

1 个答案: