批处理期间的TensorFlow重置状态=句子级语言模型

时间:2016-07-29 18:55:29

标签: tensorflow language-model

构建不跨越句子边界的循环语言模型(例如LSTM)的最佳方法是什么?或者说更一般,如果你向模型提出批处理,每行包含多个句子,你怎么能在看到每个句子后重置状态?是否有可以为模型指定的特殊标记?

谢谢!

1 个答案:

答案 0 :(得分:0)

如果句子是独立的,那么让批处理中的每一行只包含一个句子就更清晰了。然后,您可以在每批次之后重置LSTM的状态,如this question的答案中所述。