def biLSTM(data, n_steps):
n_hidden= 24
data = tf.transpose(data, [1, 0, 2])
# Reshape to (n_steps*batch_size, n_input)
data = tf.reshape(data, [-1, 300])
# Split to get a list of 'n_steps' tensors of shape (batch_size, n_input)
data = tf.split(0, n_steps, data)
lstm_fw_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0)
# Backward direction cell
lstm_bw_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0)
outputs, _, _ = tf.nn.bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, data, dtype=tf.float32)
return outputs, n_hidden
在我的代码中,我调用此函数两次以创建2个双向LSTM。然后我遇到了重用变量的问题。
ValueError:变量lstm / BiRNN_FW / BasicLSTMCell / Linear / Matrix 已经存在,不允许。你的意思是设置reuse = True in VarScope?
为了解决这个问题,我在with tf.variable_scope('lstm', reuse=True) as scope:
这导致了一个新问题
ValueError:变量lstm / BiRNN_FW / BasicLSTMCell / Linear / Matrix 不存在,不允许。你的意思是在VarScope中设置reuse = None吗?
请帮助解决此问题。
答案 0 :(得分:7)
创建BasicLSTMCell()时,它会创建所有必需的权重和偏差,以实现LSTM单元格。所有这些变量都自动分配名称。如果您在同一范围内多次调用该函数,则会得到错误。由于您的问题似乎表明您要创建两个单独的LSTM单元格,因此您不希望重用这些变量,但您确实希望在不同的范围内创建它们。您可以通过两种不同的方式执行此操作(我实际上没有尝试运行此代码,但它应该可以工作)。您可以在一个独特的范围内调用您的函数
def biLSTM(data, n_steps): ... blah ... with tf.variable_scope('LSTM1'): outputs, hidden = biLSTM(data, steps) with tf.variable_scope('LSTM2'): outputs, hidden = biLSTM(data, steps)
或者您可以将唯一的范围名称传递给函数并使用
中的范围def biLSTM(data, n_steps, layer_name): ... blah... with tf.variable_scope(layer_name) as scope: lstm_fw_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0) lstm_bw_cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0) outputs, _, _ = tf.nn.bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, data, dtype=tf.float32) return outputs, n_hidden l1 = biLSTM(data, steps, 'layer1') l2 = biLSTM(data, steps, 'layer2')
由您的编码敏感度决定哪种方法可供选择,它们在功能上几乎相同。
答案 1 :(得分:0)
我也有类似的问题。但是我使用了预先训练的Resnet50模型的keras实现。
当我使用以下命令更新tensorflow版本时,它对我有用:
conda update -f -c conda-forge tensorflow
并使用
from keras import backend as K
K.clear_session