我正在使用LSTM语言模型教程discussed here。
使用语言模型,通常在训练后使用模型从头开始生成一个新句子(即模型中的样本)。
我是TensorFlow的新手,但我正在尝试使用我训练过的模型生成新单词,直到句末标记。
我最初的尝试:
x = tf.zeros_like(m.input_data)
state = m.initial_state.eval()
for step in xrange(m.num_steps):
state = session.run(m.final_state,
{m.input_data: x,
m.initial_state: state})
x = state
失败并显示错误:
ValueError:使用序列设置数组元素。
答案 0 :(得分:7)
此处的问题似乎是m.input_data: x
传递feed_dict
中的session.run()
映射。在这种情况下,TensorFlow期望x
是一个numpy数组(或一些可以隐式转换为numpy数组的对象),但是值是TensorFlow Tensor
({{1}的结果})。
幸运的是,解决方案很简单。将tf.zeros_like()
替换为以下内容:
x = tf.zeros_like(m.input_data)
...确保将x = tf.zeros_like(m.input_data).eval()
转换为numpy数组。
(请注意,更直接的方法是将初始x
构造为适当大小的numpy数组。)