我对机器翻译感兴趣,更具体我想检查两个字符串之间的相似性。我想知道是否有深入的文本特征提取学习方法。我已经尝试过着名的统计方法,如余弦相似度,Levenstein距离,词频等。
谢谢
答案 0 :(得分:2)
要找到2字符串之间的相似性,请尝试训练 Siamese networks 在您的数据集上
连体网络是一种特殊类型的神经网络架构。神经网络学习区分两个输入,而不是模型学习对其输入进行分类。它了解它们之间的相似性。
https://medium.com/@gautam.karmakar/manhattan-lstm-model-for-text-similarity-2351f80d72f1
下面是一个讨人喜欢的比赛的链接,他们使用连体网络进行文本模拟
希望这能解除你的疑虑