背景知识:我有LSTM网络,每个网络都预测不同的事物,并接受不同的数据训练。 LSTM1训练有很多数据,LSTM2训练有较少的数据。在生产中,两个网络将同时运行。
想法是将LSTM1用作LSTM2的初始值。
我建立了这样的网络。
lstm_layer1 = rnn.LSTMCell(HIDDEN_DIM, name='LSTM1')
o1, _ = rnn.static_rnn(lstm_layer1, inp, dtype="float32")
我认为在训练LSTM2之前,必须有一种方法可以将值从LSTM1复制到LSTM2。我不知道这是如何工作的。我可以看到这些变量并知道如何访问它们的值,但无法弄清楚如何将值从一个变量传递到另一个变量。
这是我正在谈论的变量。
rnn/LSTM1/kernel:0
rnn/LSTM1/bias:0
rnn/LSTM2/kernel:0
rnn/LSTM2/bias:0
我要设置rnn / LSTM2 /内核:0 = rnn / LSTM1 /内核:0