实现音译和音译建议的标准算法

时间:2019-05-24 09:57:59

标签: algorithm google-translate levenshtein-distance transliteration google-input-tools

我已经构建了一种算法,可以将英语翻译成多种语言。由于我们应该为他们输入的单词提供适当的建议,因此我制定了在该语言词典中进行搜索的逻辑。

逻辑我已实现在该语言词典中进行搜索:

  1. 在最后一个键入的元音中进行区别,然后找到单词。 {例如:re —> r *}
  2. 以所有可能的组合替换所有元音。 {例如:test —> [tAst *,tEst *,tIst *,tOst *,tUst *]}
  3. 距离字典可能的单词最少的距离。 (Levenshtein距离算法)
  4. 在字典中查找语音相似的单词。 {例如:tast —> [tEst *,tEAst *,..]}
  5. 强调元音之间的辅音并在字典中搜索。 {例如:posible —> [可能*]}

是否有用于实现上述逻辑的音译和音译建议的标准算法

1 个答案:

答案 0 :(得分:0)

诸如LSTM之类的递归神经网络可用于预测下一组单词或建议。可以制作英语句子的训练集,以及它们的翻译版本,以及该语言中单词的所有可能组合(如单词向量)。