机器翻译中的字符串相似性有深度学习方法吗?

时间:2018-05-20 13:02:35

标签: matlab string-comparison feature-extraction machine-translation

我对机器翻译感兴趣,更具体我想检查两个字符串之间的相似性。我想知道是否有深入的文本特征提取学习方法。我已经尝试过着名的统计方法,如余弦相似度,Levenstein距离,词频等。

谢谢

1 个答案:

答案 0 :(得分:2)

要找到2字符串之间的相似性,请尝试训练 Siamese networks 在您的数据集上

连体网络是一种特殊类型的神经网络架构。神经网络学习区分两个输入,而不是模型学习对其输入进行分类。它了解它们之间的相似性。

https://medium.com/@gautam.karmakar/manhattan-lstm-model-for-text-similarity-2351f80d72f1

下面是一个讨人喜欢的比赛的链接,他们使用连体网络进行文本模拟

https://medium.com/mlreview/implementing-malstm-on-kaggles-quora-question-pairs-competition-8b31b0b16a07

希望这能解除你的疑虑