LSTM Keras API预测多个输出

时间:2017-09-07 17:44:34

标签: machine-learning keras lstm rnn

我正在训练LSTM模型,使用50个步骤的3个不同特征的序列作为输入,如下所示:

#x_train
[[[a0,b0,c0],.....[a49,b49,c49]],
  [a1,b1,c1]......[a50,b50,c50]],
  ...
  [a49,b49,c49]...[a99,b99,c99]]]

使用以下因变量

#y_train
[a50, a51, a52, ... a99]

下面的代码用于预测a,如何在给定的时间步长下预测并返回[a,b,c]的向量?

def build_model():
model = Sequential()

model.add(LSTM(
    input_shape=(50,3),
    return_sequences=True, units=50))
model.add(Dropout(0.2))

model.add(LSTM(
    250,
    return_sequences=False))
model.add(Dropout(0.2))

model.add(Dense(1))
model.add(Activation("linear"))

model.compile(loss="mse", optimizer="rmsprop")
return model

1 个答案:

答案 0 :(得分:7)

每一层的输出都取决于它有多少个单元/单位/过滤器。

您的输出有1个功能,因为Dense(1...)只有一个单元格。

只需将其设为Dense(3...)即可解决您的问题。

现在,如果您希望输出与输入具有相同的时间步长,则需要在所有LSTM图层中打开return_sequences = True

LSTM的输出是:

  • (批量大小,单位) - return_sequences=False
  • (批量大小,时间步长,单位) - return_sequences=True

然后在以下图层中使用TimeDistributed图层包装器,就好像它们也有时间步骤一样(它基本上会保留中间的尺寸)。

def build_model():
    model = Sequential()

    model.add(LSTM(
        input_shape=(50,3),
        return_sequences=True, units=50))
    model.add(Dropout(0.2))

    model.add(LSTM(
        250,
        return_sequences=True))
    model.add(Dropout(0.2))

    model.add(TimeDistributed(Dense(3)))
    model.add(Activation("linear"))

    model.compile(loss="mse", optimizer="rmsprop")
    return model