Keras LSTM层中的动态序列长度

时间:2020-02-17 18:03:17

标签: python tensorflow keras lstm

我正在用LSTM实现Keras来预测正确的单词顺序。 我的数据集由句子组成,每个句子由可变数量的单词组成,每个单词由相同数量的特征组成。 现在,我将在解析完每个句子之后计算损失函数,但是我需要为每个句子设置动态timesteps。一种解决方案可能是使用fit_generator(),但是在生成器中,我需要知道哪个句子将返回正确数量的timesteps。 另一个解决方案可能是使用pad_sequences()来固定数字,但是当我想预测一个单词的正确标签时,我必须返回到原始的句子长度而无需填充。 (例如,如果我将一个句子从6个单词填充到20个单词,那么当我预测时,隐藏状态将是20个数字的列表,但是我想要每个原始单词一个数字,所以是6个数字。)

有什么建议吗?预先感谢。

0 个答案:

没有答案