TensorFlow LSTM生成模型

时间:2015-12-16 00:34:13

标签: tensorflow lstm

我正在使用LSTM语言模型教程discussed here

使用语言模型,通常在训练后使用模型从头开始生成一个新句子(即模型中的样本)。

我是TensorFlow的新手,但我正在尝试使用我训练过的模型生成新单词,直到句末标记。

我最初的尝试:

x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
    state = session.run(m.final_state,
                               {m.input_data: x,
                                m.initial_state: state})
    x = state

失败并显示错误:

  

ValueError:使用序列设置数组元素。

1 个答案:

答案 0 :(得分:7)

此处的问题似乎是m.input_data: x传递feed_dict中的session.run()映射。在这种情况下,TensorFlow期望x是一个numpy数组(或一些可以隐式转换为numpy数组的对象),但是值是TensorFlow Tensor({{1}的结果})。

幸运的是,解决方案很简单。将tf.zeros_like()替换为以下内容:

x = tf.zeros_like(m.input_data)

...确保将x = tf.zeros_like(m.input_data).eval() 转换为numpy数组。

(请注意,更直接的方法是将初始x构造为适当大小的numpy数组。)