finetuning tensorflow seq2seq模型

时间:2017-09-18 05:59:18

标签: tensorflow lstm recurrent-neural-network machine-translation word-embedding

我已经为机器翻译训练了一个seq2seq模型(DE-EN)。我已经保存了训练有素的模型检查点。现在,我想将此模型检查点微调到某些特定的域数据样本,这在以前的培训阶段尚未见过。有没有办法在张量流中实现这一点?就像以某种方式修改嵌入矩阵一样。

我无法找到任何有关此问题的相关论文或作品。

另外,我意识到词汇文件需要根据新的句子对进行更新。但是,那么我们是否必须从头开始再次开始训练?是不是根据新样本动态更新词汇表文件和嵌入矩阵的简单方法,并继续从最新检查点进行培训?

0 个答案:

没有答案