我正在用LSTM
实现Keras
来预测正确的单词顺序。
我的数据集由句子组成,每个句子由可变数量的单词组成,每个单词由相同数量的特征组成。
现在,我将在解析完每个句子之后计算损失函数,但是我需要为每个句子设置动态timesteps
。一种解决方案可能是使用fit_generator()
,但是在生成器中,我需要知道哪个句子将返回正确数量的timesteps
。
另一个解决方案可能是使用pad_sequences()
来固定数字,但是当我想预测一个单词的正确标签时,我必须返回到原始的句子长度而无需填充。 (例如,如果我将一个句子从6个单词填充到20个单词,那么当我预测时,隐藏状态将是20个数字的列表,但是我想要每个原始单词一个数字,所以是6个数字。)
有什么建议吗?预先感谢。