应用错误收集

我正在用LSTM实现Keras来预测正确的单词顺序。我的数据集由句子组成，每个句子由可变数量的单词组成，每个单词由相同数量的特征组成。现在，我将在解析完每个句子之后计算损失函数，但是我需要为每个句子设置动态timesteps。一种解决方案可能是使用fit_generator()，但是在生成器中，我需要知道哪个句子将返回正确数量的timesteps。另一个解决方案可能是使用pad_sequences()来固定数字，但是当我想预测一个单词的正确标签时，我必须返回到原始的句子长度而无需填充。（例如，如果我将一个句子从6个单词填充到20个单词，那么当我预测时，隐藏状态将是20个数字的列表，但是我想要每个原始单词一个数字，所以是6个数字。）

有什么建议吗？预先感谢。

Keras LSTM层中的动态序列长度

0 个答案: