如何使用LSTM生成序列?

时间:2017-04-07 06:09:39

标签: python keras lstm recurrent-neural-network

我想在激活特定输入时生成序列。我想根据其相应的输入神经元激活生成奇数或偶数序列。我正在尝试使用LSTM创建模型,因为它可以记住短期订单。

我试过这种方式

import numpy as np
from keras.models import Sequential
from keras.layers import Dense,LSTM


X=np.array([[1,0],
            [0,1]])

Y=np.array([[1,3,5,7,9],
            [2,4,6,8,10]])

model = Sequential()
model.add(Dense(10, input_shape=(2))
model.add(LSTM(5, return_sequences=True))
model.add(LSTM(5, return_sequences=False))
model.add(Dense(5))
model.compile(loss='mse', optimizer='adam')

model.fit(X,Y)

但是当我试图适应模型时,它给了我这个错误

  

NameError:name' model'未定义

2 个答案:

答案 0 :(得分:3)

要在Keras中使用RNN,您需要在数据中引入一个额外的维度:时间步长。在你的情况下,你想有5个时间步。因为您希望在输入和输出数据之间建立一对多的关系,所以需要将输入数据复制5次。最后一个LSTM图层也必须设置为返回序列,因为您需要每个时间步长的结果,而不仅仅是最后一个。要使Dense图层了解时间维度,您需要使用TimeDistributed图层对其进行包装。并且最后一个Dense层只有一个输出,因为它每个时间步只输出一个结果。

import numpy as np
from keras.models import Sequential
from keras.layers import Dense,LSTM
from keras.layers.wrappers import TimeDistributed

X=np.array([[[1, 0],
        [1, 0],
        [1, 0],
        [1, 0],
        [1, 0]],

       [[0, 1],
        [0, 1],
        [0, 1],
        [0, 1],
        [0, 1]]])


Y=np.array([[[ 1],
        [ 3],
        [ 5],
        [ 7],
        [ 9]],

       [[ 2],
        [ 4],
        [ 6],
        [ 8],
        [10]]])


model = Sequential()
model.add(TimeDistributed(Dense(10), input_shape=(5, 2)))
model.add(LSTM(5, return_sequences=True))
model.add(LSTM(5, return_sequences=True))
model.add(TimeDistributed(Dense(1)))
model.compile(loss='mse', optimizer='adam')

model.fit(X,Y, nb_epoch=4000)

model.predict(X)

有了这个,我得到了大约4000个时期以下的结果:

Epoch 4000/4000
2/2 [==============================] - 0s - loss: 0.0032
Out[20]:
array([[[ 1.02318883],
        [ 2.96530271],
        [ 5.03490496],
        [ 6.99484348],
        [ 9.00506973]],

       [[ 2.05096436],
        [ 3.96090508],
        [ 5.98824072],
        [ 8.0701828 ],
        [ 9.85805798]]], dtype=float32)

答案 1 :(得分:1)

model.add(Dense(10, input_shape=(2))更改为

model.add(Dense(10, input_shape=(2,)))

model.add(Dense(5)) # Remove this 

下面注意两个代码都是等价的:

model = Sequential()
model.add(Dense(32, input_shape=(2,)))

model = Sequential()
model.add(Dense(32, input_dim=2))