我正在训练LSTM模型,使用50个步骤的3个不同特征的序列作为输入,如下所示:
#x_train
[[[a0,b0,c0],.....[a49,b49,c49]],
[a1,b1,c1]......[a50,b50,c50]],
...
[a49,b49,c49]...[a99,b99,c99]]]
使用以下因变量
#y_train
[a50, a51, a52, ... a99]
下面的代码用于预测a,如何在给定的时间步长下预测并返回[a,b,c]的向量?
def build_model():
model = Sequential()
model.add(LSTM(
input_shape=(50,3),
return_sequences=True, units=50))
model.add(Dropout(0.2))
model.add(LSTM(
250,
return_sequences=False))
model.add(Dropout(0.2))
model.add(Dense(1))
model.add(Activation("linear"))
model.compile(loss="mse", optimizer="rmsprop")
return model
答案 0 :(得分:7)
每一层的输出都取决于它有多少个单元/单位/过滤器。
您的输出有1个功能,因为Dense(1...)
只有一个单元格。
只需将其设为Dense(3...)
即可解决您的问题。
现在,如果您希望输出与输入具有相同的时间步长,则需要在所有LSTM图层中打开return_sequences = True
。
LSTM的输出是:
return_sequences=False
return_sequences=True
然后在以下图层中使用TimeDistributed
图层包装器,就好像它们也有时间步骤一样(它基本上会保留中间的尺寸)。
def build_model():
model = Sequential()
model.add(LSTM(
input_shape=(50,3),
return_sequences=True, units=50))
model.add(Dropout(0.2))
model.add(LSTM(
250,
return_sequences=True))
model.add(Dropout(0.2))
model.add(TimeDistributed(Dense(3)))
model.add(Activation("linear"))
model.compile(loss="mse", optimizer="rmsprop")
return model