标签: tensorflow language-model
构建不跨越句子边界的循环语言模型(例如LSTM)的最佳方法是什么?或者说更一般,如果你向模型提出批处理,每行包含多个句子,你怎么能在看到每个句子后重置状态?是否有可以为模型指定的特殊标记?
谢谢!
答案 0 :(得分:0)
如果句子是独立的,那么让批处理中的每一行只包含一个句子就更清晰了。然后,您可以在每批次之后重置LSTM的状态,如this question的答案中所述。