我对TensorFlow非常不熟悉,但我正在努力让项目有效。
我使用以下代码训练了LSTM:https://github.com/sherjilozair/char-rnn-tensorflow
这很棒,使用sample.py我得到了很棒的输出数据。但是,我对生成输出数据不是很感兴趣。我想要做的是从LSTM的最后一步中提取隐藏的层矢量。
基本上,我想返回一个隐藏值的数组,这些隐藏值通常会传递给LSTM中的下一个时间步(此特定模型的128维向量,在train.py中指定),紧接着运行以下model.py段:
def sample(self, sess, chars, vocab, num=200, prime='The ', sampling_type=1):
state = self.cell.zero_state(1, tf.float32).eval()
for char in prime[:-1]:
x = np.zeros((1, 1))
x[0, 0] = vocab[char]
feed = {self.input_data: x, self.initial_state:state}
[state] = sess.run([self.final_state], feed)
我不确定如何在Tensorflow中执行此操作,任何帮助都会很棒,谢谢。
答案 0 :(得分:0)