我已经使用Seq2Seq方法实现了用于音译的LSTM网络。但它只给出了给定输入序列的一个输出序列。我无法看到如何使用LSTM网络获得多个输出序列及其相关概率值。或者,如果甚至可以使用这种方法获得多种解决方案。我有一个英语单词形式的培训数据,这些单词的音译用英语以外的第二语言。我可以看到人们一直在使用LSTM来解决诸如下一个单词建议之类的问题,其中可能有多个答案。因此,音译也应该可以达到相同的效果。
答案 0 :(得分:1)
您可以使用“波束搜索”方法生成变量结果。
有很多材料可以很好地介绍它,这里有一个由CMU撰写的文章,“神经机器翻译和序列到序列模型:教程”,第7.2章。
最近,tensorflow seq2seq模型清楚地实现了光束搜索,你可以参考Tensorflow-seq2seq-BeamSearchDecoder。